代码之家  ›  专栏  ›  技术社区  ›  BCS

R程序的首选数据源是什么?

  •  3
  • BCS  · 技术社区  · 14 年前

    在列出的数据集格式中 this link 在R中最容易加载以进行处理吗?使用文本编辑器几分钟应该足以将文本版本转换为文本数据,但是其他表单中的一个可以在不到0(n)个用户的努力下加载吗?

    我找到了这个 laundry list of IO options 但似乎没有什么特别的帮助。


    另外,我以前从来没有用过R,现在 trying to help a friend 谁才是需要这样做的人。

    3 回复  |  直到 14 年前
        1
  •  4
  •   Joshua Ulrich    14 年前

    获取文本文件并按照 spreadsheet-like data section 属于 R Data Import/Export . 我会尽量避免从Excel文件中读取,除非你必须这样做。

    它可以简单到:

    x <- read.table("file.txt", header=TRUE, sep="\t")
    # or
    x <- read.delim("file.txt") # header=TRUE and sep="\t" are already defaults
    
        2
  •  4
  •   Joshua Ulrich    14 年前

    如果其他一切都失败了,为什么不读书呢? the manual devoted to Data Import / Export ?

    您可以从

    • 带分隔符(csv,txt,…)的ASCII文件
    • 固定表单文件
    • 各种格式的二进制文件( hdf5 ,NETCDF,…
    • 电子表格,大多数格式,甚至在非Windows平台上
    • 数据库(数据库) DBI , RODBC ,…)
    • 网页(使用 XML 包装)
    • Web服务 SOAP , JSON ,…
    • 直接从使用连接的其他程序…
    • 更多

    所以叫这些人中的任何一个 首选 很难——这完全取决于手头的任务。

        3
  •  1
  •   Brandon Bertelsen    14 年前

    从可用的选项中,以制表符分隔的文本文件最容易导入。然后是SPSS文件,然后是其他所有文件。我同意其他海报,避免使用.xls文件(或将单页工作簿转换为tsv、csv)。

    外部包可以用来打开这些SPSS文件,这非常简单:

    install.packages("foreign")
    library(foreign)
    
    setwd("/Path/to/your/files")
    read.spss("FILENAME.sav", to.data.frame=T)