
引入pandas库,别名为pd。
设定Excel文件的路径
文件路径为 ‘example.xlsx’
创建一个空的DataFrame用于存放合并后的数据
空的数据框用于存放合并结果 = pd.DataFrame()
假设需要合并的列名为’需要合并的列’
目标列名 = ‘目标列’
假设所有工作表数据都在第一个sheet中,以下列出所有工作表的名称(根据实际情况进行替换)
所有工作表名称 = [‘Sheet1’, ‘Sheet2’, ‘Sheet3’, ‘Sheet4’]
遍历所有工作表,执行合并操作
遍历各工作表:
读取当前工作表的数据到当前数据框中 = pd.read_excel(文件路径, sheet_name=当前工作表名称) 读取特定工作表的内容
仅保留指定列的数据到当前数据框中 = 当前数据框[目标列名] 只处理指定的列数据
将当前数据列添加到合并后的数据框中 = pd.concat([空的数据框用于存放合并结果, 仅保留指定列的数据到当前数据框中], axis=1) 合并数据框,将新数据列添加到其中
将合并后的DataFrame的列名重新设置为对应的工作表名称
重新设定合并后数据框的列名 = 所有工作表名称 使用所有工作表的名称作为新的列标题
将最终的合并结果保存为新的Excel文件,同时保留索引信息。新文件命名为:合并结果.xlsx。
整合所有工作表数据并保存为新的Excel文件,文件名称为:合并后的Excel文档.xlsx,确保索引信息得以保留。
