代码之家  ›  专栏  ›  技术社区  ›  Hugo Migneron

获取HTML文档的小节

  •  0
  • Hugo Migneron  · 技术社区  · 15 年前

    我正在尝试获取HTML页面的一个子部分。我正在寻找的功能与大多数博客上实现的功能类似。通常,在博客的主页上,你只看到文章的一部分,当你点击标题时,你会得到该博客文章的全部内容。 必须存在代码才能在不破坏HTML的情况下获取该小节。

    有人知道好的.NET代码吗?

    编辑:我需要保留内容的HTML格式,所以剥离所有HTML实际上不是一个选项。我不介意使用内容的固定长度子字符串(即前800个字符左右),但不破坏HTML将是一个噩梦。

    谢谢!

    5 回复  |  直到 15 年前
        1
  •  3
  •   Community Navdeep Singh    7 年前

    我会先从内容字符串中去掉HTML( How can I strip HTML tags from a string in ASP.NET? )那就做一个 left 在结果字符串上。

        2
  •  1
  •   Justin    15 年前

    通常,这是通过在将博客文章呈现为HTML之前对该博客文章的内容进行子字符串来实现的。

        3
  •  1
  •   jfrobishow    15 年前

    这不能通过直接剪切页面输出来实现(与HTML混淆)。

    使用显示博客内容修剪的服务器端代码来处理这个问题。

        4
  •  0
  •   BFree    15 年前

    通常情况下,完成这项工作的方法不是将一块HTML分块。相反,有一个包含博客文章的数据库,主页有自己的HTML/CSS,动态地加载每个博客文章的前X段。

        5
  •  0
  •   Community Navdeep Singh    7 年前

    在我看来,“最简单可行的方法”是浏览你想总结的博客文章,直到你进入第一个结束段落。 </p> 标签。

    别受诱惑 scan the HTML with a regex .