我正在尝试创建一个程序,该程序将允许公司的工作人员自动将信息添加到连接到 Raspberry Pi 的数字公告板上。他们将在在线表格上提交信息,然后启用 python-pptx 的程序会将其变成设计精美的 PowerPoint 幻灯片。
我设法获得了一个脚本,该脚本可以输入我的 Microsoft 表单帐户的登录信息并使用以下命令打印会话:
import requests
print('starting')
#This URL will be the URL that your login form points to with the "action" tag.
POST_LOGIN_URL = #insert URL for microsoft forms login page with username
#This URL is the page you actually want to pull down with requests.
REQUEST_URL = #insert URL you want in the microsoft forms page (responses)
payload = {
'passwd’: ‘mypassowrd'
#insert your password ('passwd' is the microsoft forms variable name)
}
with requests.Session() as session:
post = session.post(POST_LOGIN_URL, data=payload)
r = session.get(REQUEST_URL)
print(type(r))
print((r.text))
r 和 r.text 的类型是:
print(type(r))
<class 'requests.models.Response'>
print(r.text)
<class 'str'>
表单结果的 url在哪里REQUEST_URL
(页面看起来像:Microsoft Forms 结果页面)。然后我希望能够自动抓取所有结果的信息。这显示在这样的页面上:结果打印在 microsoft forms page 上。
然后我的问题是从该网址中提取信息。当我打印 r.text 时,我从页面中获取信息,但它似乎更多的是 HTTP 格式和散列(我可以包括 print(r.text) 的输出,但它有几页长并且比任何东西都更混乱)。
我正在尝试找到一种方法来可靠地从 Microsoft 表单网页复制特定数据,但目前不知道能够做到这一点的功能。有人对 python 请求库有任何经验吗?或者有没有人尝试过这样的事情?
谢谢,
卢克