代码之家  ›  专栏  ›  技术社区  ›  cpx

从网站获取特定文本

  •  2
  • cpx  · 技术社区  · 14 年前

    我正在寻找一种方法,如果你知道阅读文本的位置例如,在一个特定的类别下,你将如何连接到一个网站并从中搜索和阅读文本? 我需要遵循哪些步骤来了解这一点?

    4 回复  |  直到 14 年前
        1
  •  0
  •   David Fox    14 年前

    可以使用libcurl/curl检索html

        2
  •  0
  •   Roberto Aloi    14 年前

    你可能在找 web crawler .

    这里有一个例子 simple crawler written in C++ .

    而且,你可能想看看 wget ,通过http、https和ftp检索文件的软件。

        3
  •  0
  •   maranas    14 年前

    如果您正在查看特定的网页,可以尝试检索该网页并对其进行解析,以获得所需的准确位置。例如,特定div等。

    由于您正在使用C++,您可以尝试使用LIbCURL进行读取,以从URL检索所需的信息。

        4
  •  0
  •   anno    14 年前

    你可以下载一个html文件 WinHTTP (工作示例)然后搜索文件。在STD::String类中有一些查找ALGOS,用于搜索是否需要相对基本的。