代码之家  ›  专栏  ›  技术社区  ›  Darren Tsai

pheatmap中的一些奇怪的东西(一个bug?)

  •  2
  • Darren Tsai  · 技术社区  · 6 年前

    可复制数据:

    data(crabs, package = "MASS")
    df <- crabs[-(1:3)]
    set.seed(12345)
    df$GRP <- kmeans(df, 4)$cluster
    df.order <- dplyr::arrange(df, GRP)
    

    数据说明:

    df 有5个数值变量。我根据这5个属性做了K-means算法,并产生了一个新的分类变量 GRP 并命名它 df.order .


    pheatmap :

    ## 5 numerical variables for coloring
    colormat <- df.order[c("FL", "RW", "CL", "CW", "BD")]
    
    ## Specify the annotation variable `GRP` shown on left side of the heatmap
    ann_row <- df.order["GRP"]
    
    ## gap indices
    gapRow <- cumsum(table(ann_row$GRP))
    
    library(pheatmap)
    pheatmap(colormat, cluster_rows = F, show_rownames = F,
             annotation_row = ann_row, gaps_row = gapRow)
    

    注释颜色[[colnames(注释)[i]]中出错: 下标越界


    在这里我得到了一些奇怪的东西:

    首先,我想问题是由争论引起的 annotation_row .我检查两个数据帧的行名称。

    all.equal(rownames(colormat), rownames(ann_row))
    # [1] TRUE
    

    rownames(colormat) <- rownames(ann_row)
    pheatmap(colormat, cluster_rows = F, show_rownames = F,
             annotation_row = ann_row, gaps_row = gapRow)
    

    从理论上讲,这是一部法典 "rownames(colormat) <- rownames(ann_row)" 应该没有意义,因为这两个对象本来是相等的,但为什么它使 pheatmap() 功能工作?


    编辑: 根据@steveb的评论,我甚至不必使用 ann_row . 我刚准备好

    rownames(colormat) <- rownames(colormat)
    

    pheatmap也起作用。这种情况仍然违反直觉。


    enter image description here

    1 回复  |  直到 6 年前
        1
  •  5
  •   steveb    6 年前

    简言之 colormat rownames rownames(colormat) <- rownames(colormat) 之后这个答案开始触及问题的本质,但没有深入探讨原因或方式 pheatmap

    这个问题的性质与 返回行号的默认向量;每个元素都是一个数值,但表示为一个字符串,因此第10行成为行名“10”。使用时 attributes(colormat) ,你会看到 $row.names 之前是数值向量吗 行名称(colormat)<-行名称(colormat) 和后面的字符向量(它现在有行名)。我不清楚为什么在没有设置行名称的情况下返回任何内容(NULL或NA除外)。

    attributes(colormat)
    ## $names
    ## [1] "FL" "RW" "CL" "CW" "BD"
    ## 
    ## $row.names
    ##   [1]   1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38
    ##  [39]  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69  70  71  72  73  74  75  76
    ##  [77]  77  78  79  80  81  82  83  84  85  86  87  88  89  90  91  92  93  94  95  96  97  98  99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114
    ## [115] 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152
    ## [153] 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190
    ## [191] 191 192 193 194 195 196 197 198 199 200
    ## 
    ## $class
    ## [1] "data.frame"
    
    rownames(colormat) <- rownames(colormat)
    
    attributes(colormat)
    ## $names
    ## [1] "FL" "RW" "CL" "CW" "BD"
    ## 
    ## $row.names
    ##   [1] "1"   "2"   "3"   "4"   "5"   "6"   "7"   "8"   "9"   "10"  "11"  "12"  "13"  "14"  "15"  "16"  "17"  "18"  "19"  "20"  "21"  "22"  "23"  "24"  "25" 
    ##  [26] "26"  "27"  "28"  "29"  "30"  "31"  "32"  "33"  "34"  "35"  "36"  "37"  "38"  "39"  "40"  "41"  "42"  "43"  "44"  "45"  "46"  "47"  "48"  "49"  "50" 
    ##  [51] "51"  "52"  "53"  "54"  "55"  "56"  "57"  "58"  "59"  "60"  "61"  "62"  "63"  "64"  "65"  "66"  "67"  "68"  "69"  "70"  "71"  "72"  "73"  "74"  "75" 
    ##  [76] "76"  "77"  "78"  "79"  "80"  "81"  "82"  "83"  "84"  "85"  "86"  "87"  "88"  "89"  "90"  "91"  "92"  "93"  "94"  "95"  "96"  "97"  "98"  "99"  "100"
    ## [101] "101" "102" "103" "104" "105" "106" "107" "108" "109" "110" "111" "112" "113" "114" "115" "116" "117" "118" "119" "120" "121" "122" "123" "124" "125"
    ## [126] "126" "127" "128" "129" "130" "131" "132" "133" "134" "135" "136" "137" "138" "139" "140" "141" "142" "143" "144" "145" "146" "147" "148" "149" "150"
    ## [151] "151" "152" "153" "154" "155" "156" "157" "158" "159" "160" "161" "162" "163" "164" "165" "166" "167" "168" "169" "170" "171" "172" "173" "174" "175"
    ## [176] "176" "177" "178" "179" "180" "181" "182" "183" "184" "185" "186" "187" "188" "189" "190" "191" "192" "193" "194" "195" "196" "197" "198" "199" "200"
    ## 
    ## $class
    ## [1] "data.frame"
    

    问题不在于行名的数值与字符值,而在于是否设置了行名。如果您执行了以下操作:

    rownames(colormat) <- 1:nrow(colormat)
    

    你会发现这也会解决这个问题,就像 船名 属性(colormat) 输出)。

    如果你使用 tibble::has_rownames(colormat) 行名称(colormat)<-行名称(colormat) FALSE . 完成作业后,你将获得 TRUE

    tibble::has_rownames(colormat)
    ## [1] FALSE
    rownames(colormat) <- rownames(colormat)
    tibble::has_rownames(colormat)
    ## [1] TRUE
    

    野鸡图 但在内部,它一定遇到了这个问题 船名 没有被设定。如果您联系此软件包的作者(可能通过GitHub: https://github.com/raivokolde/pheatmap ),他们可能会更新代码,以便在下一版本中处理此紧急情况。