1

在 Pandas 中,我正在创建一个数据框,用于合并来自两个不同 Beatbox 查询的数据。首先,我提取所有机会数据,然后提取所有帐户数据,然后合并。

但是,我想通过仅提取存在于 oppty['AccountID'] 列中的帐户 ['ID'] 的数据来优化此过程,而不是在合并之前提取整个帐户数据。我该怎么做呢?

当前状态:

query_result = svc.query("SELECT ID, AccountID FROM Opportunity")
records = query_result['records']
oppty = pd.DataFrame(records)

query_result = svc.query("SELECT ID, Website FROM Account")
records = query_result['records']
account = pd.DataFrame(records)

mylist = pd.merge(oppty, account, left_on='AccountID', right_on='ID', how='left')
4

2 回答 2

2

您可以使用 SOQL 半联接将 Account 查询限制为仅具有机会的那些客户,例如

svc.query("SELECT ID,Website FROM Account where ID in (SELECT accountId FROM Opportunity)")
于 2015-06-17T01:06:18.560 回答
-1

由于我无权访问您的svc对象,这只是一个建议。但是试试

query_result = svc.query("""SELECT ID, AccountID FROM Opportunity
                            JOIN Account on Account.ID = Opportunity.AccountID""")

作为单个查询。

这应该使用左内连接提取数据,该连接会忽略两个表中不匹配的行。它还在 SQL 中进行连接,通过让数据库服务器完成工作来减少数据库流量(因此也减少网络带宽),从而减少桌面客户端系统上的计算负载。

于 2015-06-16T23:24:43.673 回答