代码之家  ›  专栏  ›  技术社区  ›  Darthoo

Java,使用ReGEXP从HTML中删除某个网站的链接

  •  -4
  • Darthoo  · 技术社区  · 6 年前

    例如,我需要删除到某个网站的所有链接 http://my-domain.com 从HTML字符串。我知道如何使用JSoup来完成它,但我不想解析HTML,我认为使用regexp可以达到我想要的目的。

    例如,我有字符串:

    <p> Hello</p> <a href="http://my-domain"> My site</a> and <a href="http://google.com> Google </a> 
    

    替换字符串后,应如下所示:

    <p> Hello</p> and <a href="http://google.com> Google </a> 
    

    你能帮我用regexp实现这个结果吗?

    1 回复  |  直到 6 年前
        1
  •  1
  •   Ralf Renz    6 年前
        String html = "<p> Hello</p> <a href=\"http://my-domain\"> My site</a> and <a href=\"http://google.com\"> Google </a>";
        System.out.println(html.replaceAll("<a href=\"http://my-domain\">.*?</a>", ""));