代码之家 › 专栏 › 技术社区 › Jakub

如何在使用feed时去掉奇怪的字符?

rss regex xml php

Jakub · 技术社区 · 14 年前

做一个简单的 str_replace 找到 â¢ li

有人碰到这个吗?无法识别或移除的角色?

下面是一些示例文本:

Required Qualifications:
â¢BSME or equivalent four year degree
â¢Minimum four years in blahblah industry experience

上面是我想清理的描述的一个例子(我想用 - ,但只要把它移走就可以了。

编辑-------

. 我怀疑这是一个编码问题,因为这个特定的位置将这个数据集输出到HTML(包含详细信息的网页)或XML提要(在描述字段中打包的HTML标记)。

我使用多个xml提要 xml2array (菲律宾比索)。我以前没有遇到过任何问题。我很确定是的 UTF-8

为了组装feed,我构建了自己的阵列服务器端,一旦将其他feed的正确值关联起来,我就输出最后一个“构建”的xml feed(然后有一个内部应用程序使用)。

消费多种来源的原因?1种格式中不可用的数据间隙。

更多编辑-------

看起来这是一个编码问题,但是我仍然没有删除 utf8_encode 但是我得到的奇怪的符号并不完全相同,所以我得到了 Ã¢[]Â¢

xml2array(URL) ,它将XML@url转换为数组,然后简单地从构建的数组中获取数据。

3 回复 | 直到 14 年前

Christophe 14 年前

该字符的html代码是 • 数字代码是 • . 可能会尝试搜索那些

$str2 = preg_replace("/â¢/", "", $str);

chiborg Alessandro Minoccheri 14 年前

PHP文件 匹配源的编码。否则 str_replace

Vantomex 14 年前

尝试 preg_replace 寻找 \u2022

推荐文章

objectively C · iTunes rss源-播客链接在手机上断开,没有通知

6 年前

13013SwagR · 特定存储库的GitLab rss源-按钮不起作用

6 年前

danish · 我应该为我的新闻应用程序项目使用rss提要吗?[已关闭]

6 年前

user3884753 · 解析XML时使用的字符(曲线引号、破折号等)

6 年前

Yuki.kuroshita · 笔(codepen)上载到服务器时不工作

6 年前

alexanoid · Java ROME RSS库和RSS描述字段中的HTML代码

6 年前

Cassie · 从RSS提要Scala中提取的记录太多

7 年前

aircraft · 在获取RSS数据时,如何确保RSS数据不重复

7 年前

cDecker32 · 需要扩展ROME的默认RSS提要模式/生成器

7 年前

Sarah · 在其他选项卡中打开rss源链接

7 年前