代码之家  ›  专栏  ›  技术社区  ›  neptune

xhtml上的Nodejs xpath选择器不工作

  •  0
  • neptune  · 技术社区  · 6 年前

    我有一个简单但格式不太好的html页面,上面有很多错误:

    <HTML>
    <head>
      <title>Official game sheet</title>
    </head>
    <body class="sheet">
    </BODY>
    </HTML>
    

    试图对从此html解析的文档应用xpath//标题。

    const document = parse5.parse(xmlString);
    const xhtml = xmlser.serializeToString(document);
    const doc = new dom().parseFromString(xhtml);
    const select = xpath.useNamespaces({
      "x": "http://www.w3.org/1999/xhtml"
    });
    const nodes = select("//title", doc);
    console.log(nodes);
    

    尝试了解决方案 from here 没有成功。返回的节点列表为空。

    Here you can see the problem.

    1 回复  |  直到 6 年前
        1
  •  2
  •   Joseph    6 年前

    这里是@neptune,不需要parse5或xmlser,只需要xpath和xmldom。

    var xpath = require('xpath');
    var dom = require('xmldom').DOMParser;
    var xmlString = `
    <HTML>
    <head>
      <title>Official game sheet</title>
      <custom>Here we are</custom>
    <body class="sheet">
    </BODY>
    </HTML>`;
    
    //const document = parse5.parse(xmlString);
    //const xhtml = xmlser.serializeToString(document);
    const doc = new dom().parseFromString(xmlString);
    const nodes = xpath.select("//custom", doc);
    //console.log(document);
    
    console.log(nodes[0].localName + ": " + nodes[0].firstChild.data);
    console.log("Node: " + nodes[0].toString());
    
        2
  •  1
  •   Abdulla Thanseeh    6 年前

    请更正这些行以获得标题

    const nodes = select("//x:title//text()", doc);
    console.log(nodes[0].data)