0

我正在尝试使用 Python 中的requests包来调用 Microsoft Bing Speech Transcription API。我可以在使用Postman时进行调用,但这需要手动选择要上传的文件(Postman 提供了一个 GUI 来选择文件),但我不确定这个文件选择如何映射到实际的 HTTP 请求(和通过扩展 Pythonrequests请求)。Postman 可以将其内部查询转换为代码,根据 Postman 的说法,它发出的 http 请求是:

POST /recognize?scenarios=smd&appid=[REDACTED]&locale=en-US&device.os=wp7&version=3.0&format=json&form=BCSSTT&instanceid=[REDACTED]&requestid=[REDACTED] HTTP/1.1
Host: speech.platform.bing.com
Authorization: [REDACTED]
Content-Type: application/x-www-form-urlencoded
Cache-Control: no-cache
Postman-Token: [REDACTED]

undefined

如果通过 Pythonrequests库发出的等效请求将是:

import requests

url = "https://speech.platform.bing.com/recognize"

querystring = {"scenarios":"smd","appid":[REDACTED],"locale":"en-US","device.os":"wp7","version":"3.0","format":"json","form":"BCSSTT","instanceid":[REDACTED],"requestid":[REDACTED]}

headers = {
'authorization': [REDACTED],
'content-type': "application/x-www-form-urlencoded",
'cache-control': "no-cache",
'postman-token': [REDACTED]
}

response = requests.request("POST", url, headers=headers, params=querystring)

print(response.text)

但是请注意,在这两种情况下,生成的代码都不会真正传递要转录的音频文件(显然 Postman 不知道如何显示原始音频数据),所以我不确定如何将这些关键信息添加到请求中。我假设在 HTTP 请求代码的情况下,音频流进入显示为“未定义”的位置。在 Python requests 命令中,从阅读文档看来,该response = requests.request(...)行应该替换为:

response = requests.request("POST", url, headers=headers, params=querystring, files={'file': open('PATH/TO/AUDIO/FILE', 'rb')})

但是当我运行这个查询时,我得到“请求超时(> 14000 毫秒)”。关于如何通过 Python 成功调用 Microsoft Speech API 的任何想法?任何帮助将不胜感激,谢谢。

4

1 回答 1

1

将此行作为您的发布请求:

r = requests.post(url, headers=headers, params=querystring, data=open('PATH/TO/WAV/FILE', 'rb').read())

这应该可以解决问题。

Microsoft 文档中,音频文件二进制数据是 POST 请求的主体,必须使用datarequests 库的参数发送。

于 2017-05-10T03:58:19.760 回答