代码之家  ›  专栏  ›  技术社区  ›  Han Zhengzu

联机读取csv时出错标记数据

  •  1
  • Han Zhengzu  · 技术社区  · 7 年前

    格式为的数据文件。csv可以在本地计算机中成功读取。

    df = pd.read_csv("./data.csv") 
    

    enter image description here

    文件正在上载 here .

    然而,我在Dropbox或Github中上传数据时使用了两种方法,读取过程中都出现如下错误:

    df = pd.read_csv("https://www.dropbox.com/s/2ew62yi0v07tjub/data-1.csv?dl=0")     
    

    错误: 熊猫/解析器。大熊猫中的pyx。解析器。文本阅读器。读取(pandas/parser.c:10364)() 熊猫/解析器。大熊猫中的pyx。解析器。文本阅读器_read\u low\u内存(熊猫/解析器c:10640)() 熊猫/解析器。大熊猫中的pyx。解析器。文本阅读器_read\u行(pandas/parser.c:11386)() 熊猫/解析器。大熊猫中的pyx。解析器。文本阅读器_tokenize\u行(pandas/parser.c:11257)() 熊猫/解析器。大熊猫中的pyx。解析器。raise\u parser\u错误(熊猫/解析器c:26979)() CParserError:标记数据时出错。C错误:第3行中应有1个字段,saw 2

    df = pd.read_csv("https://github.com/envhyf/Notebook/blob/master/data-1.csv")  
    

    CParserError:标记数据时出错。C错误:第116行应为1个字段,saw 3

    因此,我的问题是,为什么csv文件可以在我自己的计算机中读取,但在云中却失败了?

    如何解决此问题。我试过的答案是 this question 通过添加 error_bad_lines=False . 但这对我不起作用。

    1 回复  |  直到 7 年前
        1
  •  1
  •   jezrael    7 年前

    对于github,您可以使用 raw 数据:

    df = pd.read_csv("https://raw.githubusercontent.com/envhyf/Notebook/master/data-1.csv")
    

    对于 dropbox 需要 dl=1 ,信息来源 this :

    df = pd.read_csv("https://www.dropbox.com/s/gcn75c65222dtfk/data-1.csv?dl=1")