代码之家  ›  专栏  ›  技术社区  ›  Jakub

如何在使用feed时去掉奇怪的字符?

  •  0
  • Jakub  · 技术社区  · 14 年前

    做一个简单的 str_replace 找到 • li

    有人碰到这个吗?无法识别或移除的角色?

    下面是一些示例文本:

    Required Qualifications:
    •BSME or equivalent four year degree
    •Minimum four years in blahblah industry experience
    

    上面是我想清理的描述的一个例子(我想用 - ,但只要把它移走就可以了。

    编辑-------

    . 我怀疑这是一个编码问题,因为这个特定的位置将这个数据集输出到HTML(包含详细信息的网页)或XML提要(在描述字段中打包的HTML标记)。

    我使用多个xml提要 xml2array (菲律宾比索)。我以前没有遇到过任何问题。我很确定是的 UTF-8

    为了组装feed,我构建了自己的阵列服务器端,一旦将其他feed的正确值关联起来,我就输出最后一个“构建”的xml feed(然后有一个内部应用程序使用)。

    消费多种来源的原因?1种格式中不可用的数据间隙。

    更多编辑-------

    看起来这是一个编码问题,但是我仍然没有删除 utf8_encode 但是我得到的奇怪的符号并不完全相同,所以我得到了 â[]¢

    xml2array(URL) ,它将XML@url转换为数组,然后简单地从构建的数组中获取数据。

    3 回复  |  直到 14 年前
        1
  •  2
  •   Christophe    14 年前

    该字符的html代码是 • 数字代码是 • . 可能会尝试搜索那些

    $str2 = preg_replace("/•/", "", $str);
    
        2
  •  0
  •   chiborg Alessandro Minoccheri    14 年前

    PHP文件 匹配源的编码。否则 str_replace

        3
  •  0
  •   Vantomex    14 年前

    尝试 preg_replace 寻找 \u2022