问题标签 [transcription]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何以 20 秒的间隔迭代音频文件?
我正在尝试使用 转录大约 3 分钟长的音频文件SpeechRecognition
,但是,它似乎无法转录超过 20 秒的任何内容。这是我正在使用的代码:
我怎样才能循环这个,以便它转录 0s - 20s,然后是 20s - 40s 等等,直到音频文件结束?
我希望尽可能避免将文件拆分为 20 秒长的单独文件。
ios - 语音识别:备用子串始终为空,大部分时间置信度为 0
我正在尝试在 iOS 中使用语音识别,但我想我们没有交到朋友……
我已经设置了一个SFSpeechRegonizer
并相应地设置了它的委托。现在我实现委托方法如下:
每当调用委托方法时,都会打印出如下内容:
转录很好。但是,alternativeSubstrings
数组始终为空,并且confidence
大多数时间值为 0。时不时地它们是非零的——但是当这种情况发生时它是不可预测的:
为什么没有alternativeSubstrings
,为什么confidence
大部分时间都是 0,我该如何解决这个问题?我 Apple 的语音库只是坏了或有什么问题?
c# - 如何获得聊天机器人对话
我正在开发 azure bot 服务,Bot 工作正常。聊天完成后,我需要将整个聊天对话作为副本发送到电子邮件。如何做到这一点?
powershell - 为什么即使我使用 Write-Host -NoNewline,`Start-Transcript` cmdlet 也会插入换行符?
从开始-成绩单:
Start-Transcript cmdlet 将所有或部分 PowerShell 会话的记录创建到文本文件中。脚本包括用户键入的所有命令和控制台上显示的所有输出。
代码
控制台输出 - 按预期显示
成绩单内容 - 换行符从何而来?
speech-recognition - 过滤掉某些语音 Google Speech API
我正在使用 Google Speech 流 API 和 Google Text to Speech 创建一个语音机器人。我只想转录用户的语音,即使用户“打断”了语音机器人的响应。如何避免语音机器人转录自己的声音?
根据我在扬声器上使用现有语音机器人(如 Siri)的测试,“过滤”某些声音的能力似乎是可行的。
谢谢
ibm-watson - 如何开始实际的“语音转文字”?
我是一名自由作家,收集了大量需要转录的采访材料。
在浏览 Internet 时,我遇到了 IBM Watson “Speech to text”,它应该是处理大量口语的理想解决方案。
注册后,我什至无法打开它。因为我不是很擅长编程等。
有人可以提供一个示例,说明我可以遵循哪些步骤来完成我的任务?
speech-recognition - 如何使用 OneDrive 进行音频文件存储,而不是使用 Azure Blob 进行批量语音转录?
我想将 Azure 认知服务语音批处理转录 API与 OneDrive 一起使用,而不是使用 Azure blob 存储位置。这可能吗?任何可以帮助我实现相同目标的解决方法?我可以创建一个流并传递它吗?
我已经有用于批处理的 git hub示例,但将其更改为 Azure 存储以外的位置会出现错误“记录 URI 包含无效数据”。
我正在尝试更改示例中Program.cs中的 RecordingsBlobUri,我想在其中提供 OneDrive url 而不是 Azure Blob
json - 如何从我的视频中生成带有 json 煽动时间戳的脚本
我想像 Youtube 一样实时显示我的视频脚本和高文本文本。
我想要一些关于如何获取带有 Json 格式时间戳的成绩单文件的建议。
我得到了接受视频及其脚本数据并实时突出显示文本的反应工具。请提供解决方案。
java - How to transcribe bandwidth call recordings in java
My application uses https://app.bandwidth.com/ for receiving incoming calls. I have an api to handle the incoming calls which record the calls when the call is not answered(This recording is treated as a voice mail).
This is the code for recording call
Now i need to transcribe these vocie mails. From documentation i got methods in python, js, c#, ruby etc. to transcribe the recordings using the recordings. For example in js,
I searched every where, but i couldn't find any method in java for that. Can any one help me if you know ?