代码之家  ›  专栏  ›  技术社区  ›  rook

如何检查页面是否显示特定的标签

  •  2
  • rook  · 技术社区  · 14 年前

    确定网站上的页面是否真的显示这样的特定img标签的最佳方法是什么? <img src=http://domain.com/img.jpg> ?简单的字符串比较很容易被HTTP注释愚弄。 <!-- --> . 即使HTML标记存在,也可以用javascript删除它。它也可以通过使用CSS在其上放置图像来隐藏。你知道一个可靠的方法来检测img标签争议这些隐藏攻击列出?你知道另一种模糊图像的方法吗?检测图像的python代码是理想的,但是如果你知道一个好的策略或方法,我会给你一个+1。

    3 回复  |  直到 14 年前
        1
  •  1
  •   Kobi    14 年前

    我想你永远都不能确定。首先,你甚至不确定程序是否会 stop .
    除此之外,考虑以下场景。你的 <img> 可以使用javascript、css和/或服务器端添加、删除或隐藏:

    谷歌也面临着类似的问题——人们将搜索关键词隐藏在隐藏的文本和链接中,以获得更好的排名。他们的解决办法是 penalize sites with hidden text .他们之所以能逃脱,是因为他们是谷歌;人们依靠他们来进行交通。
    至于你,你最好还是好好问问…

        2
  •  1
  •   Ofir    14 年前

    我能想到的唯一可靠的方法是呈现页面并检查。删除注释等很简单,但是如果涉及到脚本,就不可能有一个不等于执行它们的通用解决方案(我相信这是我第一次调用 Church's theorem …)。

        3
  •  0
  •   schneck    14 年前

    您可以将脚本放在处理请求、统计视图和传递图像的任何位置,如下所示:

    http://yourhost.com/imageprocess?image=media/foo/bar.jpg

    然后您可以确定图像已加载。但是,如果被观看,你当然不能确定。