我有一个包含多张工作表的 excel 文件,例如Data 1
,Data 2
和Pivots
。
床单Data 1
,Data 2
每人一张桌子。该工作表Pivots
只有数据源是Data 1
和上的表的数据透视表Data 2
。
我想做的是分别用两个数据框中的数据重写数据表df1
,df2
同时保持数据透视表链接到相同的表。这个想法是运行脚本,替换Data 1
和Data 2
刷新数据透视表以获取更新的数据。
pd.ExcelWriter(xlsx_file)
将不起作用,因为它会替换文件。下面的方法改编自这个答案。
import pandas as pd
from openpyxl import load_workbook
book=load_workbook(xlsx_file)
writer = pd.ExcelWriter(xlsx_file, engine = "openpyxl")
writer.book = book
writer.sheets = dict((ws.title, ws) for ws in book.worksheets)
writer.sheets.pop("Pivots", None)
data_sheets = ["Data 1", "Data 2"]
for (k, df) in enumerate([df1, df2]):
df.to_excel(writer, data_sheets[k], index=False)
writer.save()
这失败了,因为工作表Pivots
确实将数据保留在单元格中,但是数据透视表及其所有格式都消失了。这只是硬价值观。
我该如何去做这个简单的任务?
我上传了一个示例文件,可以在这里下载。为方便起见,这里有两个数据框来替换数据表:
df1 = pd.DataFrame({"Category": ["A", "B", "C", "D", "A"], "Value": [1, 2, 3, 4, 5]})
df2 = pd.DataFrame({"SKU": ["AB", "BB", "CB", "DB", "AB"], "No of Items": [3, 2, 7, 4, 12]})
正如下面一位用户所问的那样,我将在他的解决方案建议中失败的尝试离开这里(枢轴及其所有格式都消失了,只保留了它们的硬值)。
import pandas as pd
from openpyxl import load_workbook
from openpyxl.utils.dataframe import dataframe_to_rows
df1 = pd.DataFrame([["A", 1], ["B", 2], ["C", 3], ["D", 4], ["A", 5]], columns=["Category", "Value"])
df2 = pd.DataFrame([["AB", 3], ["BB", 2], ["CB", 7], ["DB", 4], ["AB", 12]], columns=["SKU", "No of Items"])
wb = load_workbook("xlsx_file.xlsx")
sheets = ["Data 1", "Data 2"]
for (idx, df) in enumerate([df1, df2]):
ws = wb.get_sheet_by_name(sheets[idx])
rows = dataframe_to_rows(df)
for (r_idx, row) in enumerate(rows):
if r_idx != 0:
for (c_idx, value) in enumerate(row[1:]):
ws.cell(row=r_idx+1, column=c_idx+1, value=value)
wb.save("xlsx_file.xlsx")