代码之家 › 专栏 › 技术社区 › user7740495

如何遍历pandas数据帧中的每列和每个单元格

data-mining classification dataframe pandas python

user7740495 · 技术社区 · 6 年前

我有一个数据框( training_df )有4列,每列包含约150行。我还具有以下功能:

def normalise(theMin, theMax, theVal):
    if(theMin == theVal):
        return 0
    else if(theMax == theVal):
        return 1
    return (theVal - theMin) / (theMax - theMin)

现在,我想做的是依次遍历我的数据帧的所有四列,遍历每列中的所有行,对于行中的每个值(当然每行中只有一个单元格),我想用从 normalise 作用因此,我通过查看本论坛中已经提出的问题,尝试了类似的方法:

for column in training_df:
    theMin = training_df[column].min()
    theMax = training_df[column].max()    
    for i in training_df[[column]].iterrows():
        training_df[[column[i]]] = normalise(theMin, theMax, i)

但我有一个 TypeError: string indices must be integers 我对Python和pandas以及数据挖掘非常陌生,所以如果有人能澄清一下这一点,我会非常感激。提前谢谢。

1 回复 | 直到 6 年前

BENY 6 年前

我将要做的。。

df.apply(lambda x : (x-x.min())/(x.max()-x.min()))

推荐文章

Marvania Mehul - MKPatel · 确定估算其中一类概率的模型的准确性

6 年前

user7740495 · 如何遍历pandas数据帧中的每列和每个单元格

6 年前

PhD Rookie · 选择最可能选项的决策树?

6 年前

The_Anil · 获取无效类型比较错误

6 年前

Mohit Shah · 为什么在选择模型之前不进行模型调整?

6 年前

r1d1 · 主题提取和文本分类在概念上有什么区别?

6 年前

Sara · 按行从两列中选择重复项,并在R中创建一个新变量

6 年前

Bohan Xu · 互信息和预测精度

7 年前

Syahnur Nizam · 使用Weka作为引擎的基于PHP的网站

7 年前

Abdelghani Info · 为什么使用支持向量机?

7 年前