代码之家  ›  专栏  ›  技术社区  ›  allesklar

unicode问题与作为类固醇标记的行为有关

  •  2
  • allesklar  · 技术社区  · 16 年前

    我正在实现一个带有一些法语字符标签的博客。我的问题是如何处理URL中的空格和Unicode(UTF-8)字符。

    假设我有一个标签叫:ohl_l_!我的标签云中有以下代码:

    <%= link_to h(tag.name.capitalize), { :controller => :blog, :action => :tag, :id => h(tag.name) }, :class => css_class %>
    

    我该如何处理这个问题?

    1 回复  |  直到 16 年前
        1
  •  1
  •   gimel    16 年前

    ToASCII and ToUnicode 在里面 this Wikipedia article . 我希望这篇文章有足够的指针来解决你的问题。

    编辑: 虽然它说 蟒蛇 , Unicode and permalinks 可以给出如何对问题的解决方案进行编码的想法。总结:

    基本上,unicode url是以utf8编码的,utf8编码字符串的每个字节都是使用百分比编码的。浏览器显然识别出了这个特定的编码方案(在我可以找到的任何地方都没有记录),并为用户显示了很好的国际化URL。

    对不起,我不知道如果 栏杆 有一个现成的函数可以用这种方式对URL进行编码。