百科知识

Python技巧解析:如何合并Excel工作表中的sheet页,将特定列数据进行合并处理

Python技巧解析:如何合并Excel工作表中的sheet页,将特定列数据进行合并处理

引入pandas库,别名为pd。

设定Excel文件的路径

文件路径为 ‘example.xlsx’

创建一个空的DataFrame用于存放合并后的数据

空的数据框用于存放合并结果 = pd.DataFrame()

假设需要合并的列名为’需要合并的列’

目标列名 = ‘目标列’

假设所有工作表数据都在第一个sheet中,以下列出所有工作表的名称(根据实际情况进行替换)

所有工作表名称 = [‘Sheet1’, ‘Sheet2’, ‘Sheet3’, ‘Sheet4’]

遍历所有工作表,执行合并操作

遍历各工作表:

读取当前工作表的数据到当前数据框中 = pd.read_excel(文件路径, sheet_name=当前工作表名称) 读取特定工作表的内容

仅保留指定列的数据到当前数据框中 = 当前数据框[目标列名] 只处理指定的列数据

将当前数据列添加到合并后的数据框中 = pd.concat([空的数据框用于存放合并结果, 仅保留指定列的数据到当前数据框中], axis=1) 合并数据框,将新数据列添加到其中

将合并后的DataFrame的列名重新设置为对应的工作表名称

重新设定合并后数据框的列名 = 所有工作表名称 使用所有工作表的名称作为新的列标题

将最终的合并结果保存为新的Excel文件,同时保留索引信息。新文件命名为:合并结果.xlsx。

整合所有工作表数据并保存为新的Excel文件,文件名称为:合并后的Excel文档.xlsx,确保索引信息得以保留。


Python技巧解析:如何合并Excel工作表中的sheet页,将特定列数据进行合并处理

你可能也会喜欢...