问题标签 [transcription]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
563 浏览

java - GCP 语音转文本 - Java API 不起作用

我在 Chrome 浏览器中使用 MediaRecorder 录制了一个示例 .webm 文件。当我使用 Google 语音 java 客户端获取视频的转录时,它返回空转录。这是我的代码的样子

如果,我使用相同的文件并访问https://cloud.google.com/speech-to-text/并在演示部分上传文件。它似乎工作正常并显示转录。我对这里出了什么问题一无所知。我验证了演示发送的请求,这里看起来像

在此处输入图像描述

我正在发送确切的参数集,但这不起作用。尝试将文件上传到云存储,但这也给出了相同的结果(没有转录)。

0 投票
1 回答
359 浏览

speech-to-text - 是否有用于语音到文本分类的扬声器错误率算法?

一些语音到文本服务,如 Google Speech-to-Text,通过分类来提供说话者区分,该分类尝试识别和分离单个音频记录中的多个说话者。当多个发言者在会议室中共享一个麦克风时,通常需要这样做。

是否有算法和实现来计算说话人分离的正确性?

这将与经常用于测试基线转录正确性的单词错误率结合使用。

0 投票
2 回答
140 浏览

javascript - 如何通过 TTML 浏览并将所有时间\标题放入 JSON 文件

我有一个包含视频字幕的 ttml 文件,我想通过所有对 time\caption 获取并将它们放入 JSON 文件中,我尝试过https://www.npmjs.com/package/ttml?activeTab=readme但是它没有用这个。有任何想法吗 ?谢谢

0 投票
1 回答
387 浏览

python - python中给定mrna序列的密码子计数

这是我一直在尝试使用但无法正常工作的代码:

预期起始密码子:AUG

预期的终止密码子:UAAUAGUGA 如果例如:

我真的不知道出了什么问题。

0 投票
0 回答
57 浏览

ios - 我们如何将任何格式类型的已录制(现有)音频文件转换为带有 swift 语言的 flac 格式以进行转录(Google Speech Api)?

迅速

对于 Google Speech Api:“ https://speech.googleapis.com/v1/speech:recognize?key= ${API_KEY}”

0 投票
1 回答
1362 浏览

python - 寻找一种方法来检测音频文件中的停顿,然后能够在句子之间设置标点符号?

我有一个转录应用程序,可以将音频从文件转录为文本。问题是输出文本是一个长句子。所以我想一个解决方案可能是在音频文件中寻找停顿并在转录中添加标点符号。

如果音频内容是这样的:你好吗?--暂停--我很好。--pause-- 准备好开始了吗? - 暂停 -

它会转写成:你好吗。我很好。准备开始。

我的代码如下所示:

结果:

“一个长句子中的很多文本很难阅读,因为句子之间没有标点符号来修复这个必须通过某种语法服务来修复它但是他们并不擅长设置标点符号所以模块/包也可以很好地完成这项工作”

如果不是,那么可能是这样的:检测音频文件中的静音

0 投票
0 回答
122 浏览

r - R 中的 GenomicFeatures 函数“transcriptsByOverlaps()”出错

由于 subseq() 函数和 DNAString 函数(来自 biomaRt),我从染色体 1 中检索了 DNA 序列,我的目标是找到该序列中所有可能的转录本。

我想找到 GRange 对象“Txdb”(人类染色体 1 的所有转录本)和我之前获得的 DNA 序列(我必须构建一个 Grange 对象,开始和结束位置进入 chr1)之间的重叠函数transcriptsByOverlaps()

这是代码:

我什至运行了我在 transcriptsByOverlaps() 函数的帮助中找到的示例,它得到了同样的错误:

有人可以帮忙吗?我阅读了帮助,但我不明白如何解决这个问题。谢谢你。

这是 SessionInfo()

0 投票
1 回答
803 浏览

java - 使用 AWS 转录时主机名不能为空错误

我目前有代码:

但我收到错误:

我查看了主机名错误,发现它有时是由于区域错误,但我很确定它是正确的,因为我的 s3 正在工作。欢迎任何帮助。

0 投票
1 回答
207 浏览

python - 如何为两人对话改进 GCP 的 Speech to Text API 结果

我需要一些库或 API 来映射音频和手动转录的文本,以便我可以获得每个单词的时间戳。尝试使用 GCP 转录并获取时间戳,但错误率太大,增加了手动工作。音频文件是医生和病人之间的对话,所以病人的声音不是很听得见。我想这就是为什么 GCP 无法正确转录它的原因。

理想情况下,我想减少手动工作并获得准确的结果。

0 投票
1 回答
24 浏览

windows - 在系统使用转录文件时禁止配置文件脚本

我在配置文件中使用了一个小脚本,以便在脚本文件变得太大时更新它(超过给定的行数,会触发更新过程);它所做的是启动转录文件的副本,删除转录文件并启动另一个具有相同名称的转录文件。但是,当启动 ISE 的补充实例时,脚本将再次运行,并且当达到脚本文件上的行数限制时,会导致错误语句表明无法将脚本文件删除为它正被一个进程使用(这个进程是主实例上的转录——除了最初在会话中打开的实例之外没有其他实例的转录,但是打开一个新实例会在屏幕顶部产生,声明说成绩单文件已经开始)。如何使脚本的执行以系统不使用脚本文件为条件?错误消息不是问题,因为它已经是文件太大的警告,并且可以忽略它,但最好不要在每次打开新文件时将它放在屏幕顶部实例。