python - 如何使用 python-pptx 包自动从 Microsoft Forms 中提取信息？

Question

我正在尝试创建一个程序，该程序将允许公司的工作人员自动将信息添加到连接到 Raspberry Pi 的数字公告板上。他们将在在线表格上提交信息，然后启用 python-pptx 的程序会将其变成设计精美的 PowerPoint 幻灯片。

我设法获得了一个脚本，该脚本可以输入我的 Microsoft 表单帐户的登录信息并使用以下命令打印会话：

import requests

print('starting')

#This URL will be the URL that your login form points to with the "action" tag.
POST_LOGIN_URL = #insert URL for microsoft forms login page with username 

#This URL is the page you actually want to pull down with requests.
REQUEST_URL = #insert URL you want in the microsoft forms page (responses)

payload = {
    'passwd’: ‘mypassowrd' 

#insert your password ('passwd' is the microsoft forms variable name)

}

with requests.Session() as session:
    post = session.post(POST_LOGIN_URL, data=payload)
    r = session.get(REQUEST_URL)
    print(type(r))
    print((r.text))

r 和 r.text 的类型是：

print(type(r))
<class 'requests.models.Response'>

print(r.text)
<class 'str'>

表单结果的 url在哪里REQUEST_URL（页面看起来像：Microsoft Forms 结果页面）。然后我希望能够自动抓取所有结果的信息。这显示在这样的页面上：结果打印在 microsoft forms page 上。

然后我的问题是从该网址中提取信息。当我打印 r.text 时，我从页面中获取信息，但它似乎更多的是 HTTP 格式和散列（我可以包括 print(r.text) 的输出，但它有几页长并且比任何东西都更混乱）。

我正在尝试找到一种方法来可靠地从 Microsoft 表单网页复制特定数据，但目前不知道能够做到这一点的功能。有人对 python 请求库有任何经验吗？或者有没有人尝试过这样的事情？

谢谢，

卢克

python - 如何使用 python-pptx 包自动从 Microsoft Forms 中提取信息？

0 回答 0

Related

Reference