代码之家  ›  专栏  ›  技术社区  ›  Thyago S

如何使用Jsoup从inter DIV中提取文本?

  •  0
  • Thyago S  · 技术社区  · 7 年前

    我试图从主div类中的div类中提取文本。我尝试使用的代码片段的一个示例是:

    <div class="main">
      <div class="01"></div> 
      <div class="02"></div>
      <div class="03">
         <span class=""></span>
         <div class="content"> **TEXT TO EXTRACT** </div>
      </div> 
    </div> 
    

    Document doc = Jsoup.connet(url).get();
    Elements title01 = doc.select("div.main > div > div > div");
    
    txt01 = title01.text();
    

    此代码无效。怎么了?

    1 回复  |  直到 7 年前
        1
  •  0
  •   Vanna    7 年前

    解决方案非常简单:

    Elements elements = doc.select("div.main div.content");
    

    如果内容div不必位于主div内,您可以这样做:

    Elements elements = doc.select("div.content");
    

    为什么你的代码不起作用

    1. div.main div 带类 main
      CurrentCollection={main}
    <div class="main"> 
     ......
    </div>
    
    1. > div 主分区 对于 部门
        <div class="01"></div> 
        <div class="02"></div>
        <div class="03">.....</div>
    
    1. >部门 搜索每个元素 CurrentCollection 部门
            <div class="content"> **TEXT TO EXTRACT** </div>
    
    1. > 搜索中的每个元素 电流采集 对于 部门
      CurrentCollection={}