代码之家  ›  专栏  ›  技术社区  ›  Mislav

下载的html页无法识别utf-8字符

  •  0
  • Mislav  · 技术社区  · 6 年前

    download.file("https://sljeme.usud.hr/usud/praksaw.nsf/Praksa/C12570D30061CE54C1257BEC0043CA4C?OpenDocument",
                  destfile = paste0("test", ".html"),
                  mode = "wb")
    

    该文件已成功下载,但当我在windows中打开它时,它没有显示一些克罗地亚字符(,)。我也尝试过用 write.table ,但那没用。

    我在上面没有看到任何元数据 charset 在html源代码中。这是主要问题吗?如何克服这个问题?

    0 回复  |  直到 6 年前