代码之家 › 专栏 › 技术社区 › Led

python:如何拆分按第一列分组的Excel文件

pandas excel python

Led · 技术社区 · 6 年前

我有一个表需要拆分成多个文件,按列1中的值分组-序列号。

+--------+--------+-------+
| serial |  name  | price |  
+--------+--------+-------+
| 100-a  | rdl    |   123 |  
| 100-b  | gm1    |  -120 |  
| 100-b  | gm1    |   123 |  
| 180r   | xxom   |    12 |  
| 182d   | data11 | 11.50 |  
+--------+--------+-------+

输出如下:

100-a.xls
100-b.xls
180r.xls etc.etc.

打开100-B.XLS意味着:

+--------+------+-------+
| serial | name | price |  
+--------+------+-------+
| 100-b  | gm1  |  -120 |  
| 100-b  | gm1  |   123 |  
+--------+------+-------+

我尝试使用pandas通过以下代码定义数据帧:

import pandas as pd
#from itertools import groupby

df = pd.read_excel('myExcelFile.xlsx')

我很成功地获得了数据框架,但我不知道下一步该怎么做。我试着跟着这个 similar question on Stackoverflow 但是情况有点不同。下一步该怎么办?

1 回复 | 直到 6 年前

Nick M 6 年前

这不是GroupBy,而是一个筛选器。

您需要遵循两个步骤:

在Excel文件中生成所需的数据
将数据框另存为Excel。

像这样的东西就可以了-

for x in list(df.serial.unique()) :
    df[df.serial == x].to_excel("{}.xlsx".format(x))

推荐文章

Mainland · Python数据帧规范化值错误:列的长度必须与键相同

1 年前

user026 · 如何根据特定窗口的平均值(行数)创建新列?

1 年前

rpn · 如何在列[1]中连续第二次出现“0”时返回列[0]的值

1 年前

asmgx · 为什么合并数据帧不能按照python中的预期方式工作

1 年前

Gtoth · 如何分割Pandas DataFrame中包含多个日期的两个时间戳之间的差异

1 年前

Domarius · 使用loc为多行设置多列值

1 年前

Swastik Bhattacharyya · 如何在同一类别类型的多列上运行get_dummies()函数?

1 年前

DrZoidberg09 · 如何在字典列表中创建一个新关键字,该关键字是另一个关键字的总和?

1 年前

armstrong3701 · 如何有效地处理熊猫数据框中缺失的数据并计算条件统计?

1 年前

msts1906 · 大熊猫向乳胶的适当多品种出口

1 年前