1
1
我们在对问题的评论中的讨论摘要线性判别分析不适用于具有比观测值更多特征的数据集,因此需要某种形式的正则化。如果你想做分类,但主要对预测模式感兴趣,而不是预测本身,你可以使用偏最小二乘判别分析(PLSDA)。 然而,在您的案例中,PLSDA的成分可能很难解释,因为它们将包含每个基因一个系数,但相信所有50000个基因都与您正在研究的表型相关似乎是不现实的。我更喜欢的另一种方法是 nearest shrunken centroids 或 elastic net 产生稀疏模型(即,它们只保留最好的基因,而丢弃那些无关紧要的基因)。 |
2
0
您可以在数据集的样本上运行LDA模型。 |
Tahlil · 在正交基中将三维三角形转换为二维三角形 7 年前 |
Ktt · 是否可以投影子数组并将其作为一个数组检索? 7 年前 |
Resindra Aji · OpenGL纹理投影穿过曲面 7 年前 |
carderne · Python:将以公里为单位的地图转换为度 8 年前 |
dimart.sp · 从OpenGL获取相机矩阵 8 年前 |
Misconstruction · 大型数据集LDA的替代方案 9 年前 |