![]() |
1
3
我只是有一个标记化字符串的建议。如果单词都由字符串分隔,那么您的方法会很好地工作,但在大多数使用场景中,这种情况很少发生,因为您通常需要处理换行符、标点符号等。如果您感兴趣,请尝试以下操作:
来源: http://www.tech-recipes.com/rx/3418/cocoa-explode-break-nsstring-into-individual-words/ |
![]() |
2
6
淫秽过滤:坏主意,或者难以置信的交流坏主意? 在开始编写这样一段代码之前,Jeff有一篇有趣的文章要考虑: |
![]() |
3
2
好吧,以这种方式搜索当然不是寻找亵渎的最有效方法…一种更有效的方法是构造一个有限状态自动机来检测单词,并在该fsa中运行文本一次。您不需要真正地拆分字符串来发现亵渎,而所有这些拆分都会增加额外的分配和复制开销,这是您不需要的。此外,在一些黑名单单词中可能有一些常见的模式,您不能通过单独搜索每个单词来利用这些模式。 也就是说,我觉得400个字相当多。你的观众到底是谁?如果用户有医疗问题怎么办?这样的问题真的应该被拒绝吗?在任何上下文中,我只能想到少数被认为是亵渎的词,所以您可能需要重新考虑过滤。 |
![]() |
4
0
一些事情:
我的公司Inversoft构建了一个商业过滤解决方案,它非常智能。它不使用regex或fsa,但有一个定制的快速线性处理技术,使它非常快速和准确(每秒4000多条消息)。它还拥有600多个英语词汇,包括俚语、种族歧视、毒品、帮派、宗教等。 如果您正在寻找支持的智能上下文感知解决方案,那么您应该查看Inversoft的CleanSpeak。将它连接到obj-c应该使用XML WebService很简单。 |
![]() |
Martin sku · 在目标C中打印时间 2 年前 |
![]() |
Vinod prajapat · 如何更新数组的最后一个元素? 2 年前 |
![]() |
subin272 · 修复iOS中的多个按钮单击事件? 6 年前 |
![]() |
James Chan · 如何使用锁定/解锁? 6 年前 |
![]() |
Josh F. · NSBundle mainBundle返回零 6 年前 |