问题标签 [microsoft-speech-platform]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 微软官方网站上的语音平台错误 404
我需要安装以下软件包才能使用 Microsoft Speech Platform:
- Microsoft 语音平台 - 运行时,
- 微软语音平台 - SDK,
- Microsoft 语音平台 - 运行时语言。
大约一年前我已经这样做了,但今天我在 Microsoft 的网站上找不到它们。当我尝试访问旧链接时,404 ERROR
发生了一个。
有没有办法再次获得这些包裹?
microsoft-speech-platform - 微软语音转文本批量转录状态在一个多小时后保持未启动
从某一天开始,所有提交到 Speechtotext api 的音频文件都保持“未启动”状态。要转录的文件存储在 S3 存储桶中。通过带有一小时令牌的 url 提交。
这是我们询问状态时收到的响应示例。提交后似乎什么也没发生。
我该如何调查这个问题?
botframework - Microsoft 语音合成器词典无法正常工作
我已按照此处的示例向我的语音 SSML 添加自定义词典。然而,它被忽略了。我用我自己的词典和示例进行了尝试。起初,样本似乎可以工作,但是当我删除词典时,它仍然将 BTW 扩展为“顺便说一句”,所以它似乎对样本也没有影响。
作为参考,这里是用于创建词典的示例代码
这是示例 SSML(其中忽略了词典)
我尝试从本地存储以及 Azure App Service 托管的站点访问词典。我还查看了 Javascript 在 SpeechConfig 或 SpeechSynthesizer 中是否有任何类型的“addLexicon”方法,但我找不到任何东西。任何人都知道为什么这不起作用以及我需要做些什么来解决它?
azure - Azure 的 Speech to Text 服务是否接受 Webm 音频并提供带有时间戳的输出?
我正在尝试确定 Azure 是否是满足我转录需求的最佳平台。
我有两个问题——Azure 的 Speech to Text 服务是否提供:
- 接受 Webm 音频作为输入?
- 它是否提供带有时间戳的输出?
speech-to-text - 浏览器应用程序中 JavaScript SDK 中的 Microsoft Azure 语音转文本行为
我已经在浏览器应用程序的 JavaScript SDK 中部署了 Azure 语音到文本 SDK。在以下场景中发现困难。
- 当试图在已经有文本的文本框中开始听写时,它总是从文本的末尾开始。我不能从现有文本的开头或中间开始。
- 如果文本框有数据并且当数据被清除并且我开始听写后,转换的文本以及之前删除的文本都会出现。口述文本附加到先前删除的文本。
- 如何禁用自动标点符号?例如,如果我在听写过程中暂停,句子会自动以句号结束。如果我说你好吗,结果就是你好吗?
预期成绩:
- 根据我在文本框中的光标位置,它应该从该位置开始语音到文本。
- 删除的文本不应重新出现。
- 想要禁用自动标点符号并在听写中使用句号、问号、感叹号等听写词。
speech-to-text - 每种语言的 Azure 语音听写单词列表
在听写模式打开的 Azure 中使用语音转文本时,它会识别“问号”之类的单词并返回“?”。我们找到了类似这样的其他词并正在寻找完整的列表,但无法在文档中找到它(https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/index-speech - 到文本)