代码之家  ›  专栏  ›  技术社区  ›  Md. Suman Kabir

无法使用vb.net从网页源获取非英文字符

  •  0
  • Md. Suman Kabir  · 技术社区  · 6 年前

    我多次使用下面提供的代码块来获取网页的源代码,这在我的案例中一直有效。

    ServicePointManager.SecurityProtocol = SecurityProtocolType.Tls12
    Dim wc As New WebClient
    wc.Encoding = Encoding.UTF8
    Dim Source As String = wc.DownloadString("https://www.rp.pl/")
    

    此代码无法使用 Encoding . 我试过其他的 编码 也没有运气。就像在页面上一样,有一个标题“rafa_trzaskowski kontra tvp”。chce sprostowania”,但在通过上述代码片段获取源代码后,它显示“rafa_?½trzaskowski kontra tvp”。中国科学院。

    有人能帮我更正我的代码以便准确地获取页面源代码吗?

    2 回复  |  直到 6 年前
        1
  •  1
  •   CruleD    6 年前

    wc.Encoding = Encoding.GetEncoding(1250)
    

        2
  •  0
  •   Colonbracket    6 年前