![]() |
1
1
SQL Server全文搜索功能使用IFilter从PDF或Office文件格式提取纯文本。您可以在服务器上安装iFilter,或者如果您的代码与SQL Server运行在同一台计算机上,则您已经拥有它。 下面是一篇文章,介绍如何使用.net中的iFilter: http://www.codeproject.com/KB/cs/IFilter.aspx |
![]() |
2
3
如果不一定要直接从sql server流到应用程序中,那么最困难的部分就是解析pdf或doc文件格式。 iTextSharp库将允许您访问PDF文件的内部: http://itextsharp.sourceforge.net/ 下面是一款宣称可以解析word文档的商业产品: 编辑以添加: 我想您也在问是否有办法通过添加ifilter使sql server全文索引为您完成这项工作。这听起来是个好主意。我自己并没有这样做,但微软显然已经支持一个词过滤器很长一段时间了,现在adobe已经发布了一个(免费)pdf过滤器。这里有很多信息: 10 Ways to Optimize SQL Server Full-text Indexing SQL Server Full Text Search: Language Features -有点过时,但很容易理解。 |
![]() |
3
1
您可以从您的C应用程序中打开.doc文件并将其保存为文本,然后将文本和.doc文档都放入数据库中。 |
![]() |
4
1
如果您使用的是sql 2008,那么可以考虑使用新的 FILESTREAM 特征。 数据存储在varbinary(max)列中,但也可以通过常规的win32句柄访问原始数据。 Here's some sample code 演示如何获得手柄。 |
![]() |
5
1
我也有同样的问题…我通过在申请表中添加以下内容解决了这个问题:
我使用这些来获取纯文本,然后将其与二进制数据一起存储在数据库中。请记住,我当然不是专家,所以可能有更好的方法来做到这一点,但这对除了“快速保存”2007年以前的word文档以外的所有内容都有效,这些文档显然不是由ifilter读取的。如果出现错误,我只是让用户重新保存文档,一切正常。 如果您需要一些示例代码,请告诉我…我现在就寄,但有点长。 |
|
Robert King · Unity C#语法问题-转换位置 1 年前 |
![]() |
JBryanB · 如何从基本抽象类访问类属性 1 年前 |
|
law · 检查答案按钮的输入字符串格式不正确 2 年前 |
![]() |
i_sniff_ket · 在unity之外使用unity类 2 年前 |