使用python中的pandas,xlrd,openpyxl庫完成合并excel中指定sheet的操作
# -*- coding: UTF-8 -*- import xlrd import pandas as pd from pandas import DataFrame from openpyxl import load_workbook #表格位置 excel_name = '1.xlsx' # 獲取workbook中所有的表格 wb = xlrd.open_workbook(excel_name) #獲取sheets sheets = wb.sheet_names() # 循環(huán)所需sheet newdata = DataFrame() #in后()里填寫需要合并的sheet頁數 for i in (3,4,5): df = pd.read_excel(excel_name, sheet_name=(i-1), header = None,index_col=0,encoding='utf-8') newdata = newdata.append(df,ignore_index = False) #保存為新的sheet,首先新建sheet,合并后的數據保存到新sheet中 writer = pd.ExcelWriter('1.xlsx',engin='openpyxl') book = load_workbook(writer.path) writer.book = book #利用dataframe.to_excel保存合并后的數據到新的sheet,生成新的sheet命名為newdata newdata.to_excel(excel_writer=writer,sheet_name="newdata") writer.save() writer.close() print('處理完成!')
其中
df = pd.read_excel(excel_name, sheet_name=(i-1), header = None,index_col=0,encoding='utf-8')
需要指定 header = None,否則會出現如下warning:
FutureWarning: Sorting because non-concatenation axis is not aligned. A future version
of pandas will change to not sort by default.
并且生成的新sheet中的列會出現亂序以及Unnamed列。
補充:pandas 中讀取和寫入csv文件時候出現Unnamed:0的解決方案
在讀取csv文件的時候,默認會自動添加新的一列,Unnamed:0
read_csv()時候,設置index_col=0即可。
在寫入csv文件的時候,默認會自動加入新的一列,Unnamed:0
to_csv()時候,設置index=False?;蛘呒由蟟ndex=True, index_label="id"
以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。