项目的目标是自动化一些数据获取过程。我的数据由来自不同资源的 4 个不同的 google 表格组成,这些表格在加入后构建 prefinal 文件,这个 prefinal 文件用于计算业务数量。我已经在 prefinal sheet 中使用了 4 个不同工作表的自动化过程,并且在我的 jupyter 笔记本上一切正常,但是在使用 Pygsheets 将我的最终 Pandas Dataframe 传输到 google sheet 时,我在 Dataframe 中的一些列的数据类型正在改变并产生错误的数据和计算(从日期类型到数字。
请检查数据框
https://drive.google.com/open?id=1-w1USWl2NJLxYi1Nv52q3l1tlOFJZCmL
和结果谷歌表
https://drive.google.com/open?id=1KuG2vrBrwvvsEDCjkB9FH4-Y0Ihgqidc
我正在使用 Google drive API 和 Pysheets 来完成任务,我的代码示例就像
import pandas as pd
import datetime
import getRedshiftConfig
from redshift_connection import Connection
import pygsheets
import numpy as np
import gspread
from oauth2client.service_account import ServiceAccountCredentials
import imaplib
import base64
import os
import email
prefinal_df=pd.read_csv("xyzzy.csv")
gc = pygsheets.authorize(service_file = "gsheetss.json") # Authorizing the Credentials
sh = gc.open('WHTAT_BaseData')
wk1=sh.sheet1
wk1.rows=df_neww.shape[0]
wk1.set_dataframe(df_neww,'A1')