问题标签 [transcription]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
241 浏览

powershell - Powershell 时间戳记录

由于环境受限,我想在 Powershell 中运行 plink (Putty) 以生成 Powershell/plink 会话的时间戳记录。

我在本机 powershell 中看不到时间戳选项。这样做的最佳方法是什么?

我考虑过使用 Tee,但由于 plink 不是 PS 对象,我不确定我可以。

0 投票
1 回答
206 浏览

python - Twilio:将记录转录成文本(python)

我必须编写一个小监控工具,该工具可以向热线拨打电话,以查看一切是否按预期工作。

目标:拨打热线电话,记录 20 秒,将记录转录成文本,进行比赛。拨打外线电话并进行录音非常简单。我遇到的问题是记录的转录。有一个代码片段如何进行转录,但我不知道如何使用它。

我的脚本进行出站呼叫并记录呼叫:

Twilio Doku 中的代码片段如何转录:

0 投票
1 回答
38 浏览

r - 如何将“获取标题”功能应用于列中的每一行?

我在 R 中创建了一个数据框,其中第 2 列包含我从 YouTube 中提取的每一行的 URL。下载了 youtubecaption 包,并希望将“get_caption()”函数应用于具有 URL 的列中的每一行。这是因为我想从我收集的每个 URL 转录音频。

我尝试通过执行以下操作来创建一个函数来自动执行此操作:

然后我尝试使用 apply 函数在列中的每个 url 上使用 get caption:

但是,它没有用。你有什么建议吗?谢谢!!

0 投票
1 回答
206 浏览

flutter - 使用 Dart 进行实时语音转录

我有实时语音转录的问题。在我的应用程序中,人们可以根据他们的语言选择互相进行视频通话,我想向用户实时显示对话的字幕。我使用 Agora SDK 进行视频通话功能。是否可以添加实时转录?

我找到了Google Cloud Speech API,但没有足够的 dart 文档。如果你能给我一些起点,我真的很高兴

0 投票
1 回答
84 浏览

r - 是否有任何简单/基本的方法可以使用 R 拆分文本转录本?

基本上,我有一个 .txt 文件,其中包含两个参与者之间的谈判记录,其格式为:

Name Time Stamp Text Name Time Stamp Text

依此类推,以进行完整的对话。有没有办法对 R 进行编码以将此记录拆分为单独的变量,以便名称变量、时间戳变量和完整记录的文本变量?

我一直在手工完成,但随着成绩单越来越长,要做的事情越多,手工完成的难度就越大。我知道有一些用于解析文本的代码用于情感分析等,但据我所知,我只知道如何编写代码来提取特定的词性。

任何帮助将不胜感激。

0 投票
3 回答
41 浏览

javascript - 当时间是时间数组中的时间时,从单词数组中返回一个单词。Javascript - 反应

我正在使用 React 为音频或视频文件构建转录服务。

后端完成了,我得到了这两个数组:

我有一个时间数组,以秒为单位:

我还有一系列单词:

我只想在时机合适时突出显示一个单词。

除了无限的“if”语句之外,还有其他方法吗?

(*时间等于视频/音频播放器)

谢谢!

0 投票
0 回答
122 浏览

python - 由于无声时刻,在 SpeechRecognition 中读取整个音频的问题

我在使用 Google 识别器 API 使用 SpeechRecognition 转录整个音频时遇到问题。即使我的音频被正确读取,也只是检测到并转录了它的第一句话。那是因为我的音频文件中有很多“静默秒”,我猜算法正在检测其中的第一个作为我的音频的结尾并中断转录。

为了解决这个问题,我尝试使用energy_thresholdpause_threshold参数,它们似乎没有任何区别(我已经检查了许多不同的值)。

有谁知道如何正确调整 SpeechRecognition 等待的时间段(而不是视为音频的结束)?

0 投票
2 回答
80 浏览

python - 以三个一组的形式解析列表列表中的项目,并在阅读框之间提取片段。(AKA DNA 外显子转录)

我试图找到一种方法来读取列表列表中的项目,一组三个,并找到 3 个项目(密码子)的组合来确定片段的开头,并找到 3 个项目的另一个组合来找到结尾一个片段(终止密码子)。

因此,程序应该像这样读取阅读框和列表:

清单1:XXXXXX-开始-感兴趣的片段-停止-XXXXXXX

我要做的只是提取感兴趣的片段并将其附加到另一个列表中,然后摆脱其余部分。

这是一个更具体的例子:

起始密码子:ATG

终止密码子:TAG

基因_1 = 'ACGGACTATTC'

基因_2 = 'GGCC ATG AGTAACGCA TAG GGCCC

基因_3= GGGCCC ATG ACGTAC标记GGGCCC ATG CATTCA标记

所以,第一个列表不包含任何感兴趣的片段,而第二个包含 1,第三个包含 2。我试图摆脱这些阅读框架之外的所有内容,并将这些感兴趣的片段附加到一个应该看起来像的列表中像这样。

frag_int = ['AGTAACGCA','ACGTAC','CATTCA']

这是我到目前为止所拥有的:

#这些是str genelist=[]

但它并没有真正回馈任何东西,我想知道代码是否过于冗余,我真的不需要在这里定义一个函数,你知道有什么更好的方法吗?哈哈!!

0 投票
1 回答
256 浏览

opentok - OpenTok 实时音频转录

我正在尝试实时转录 OpenTok 会话中的音频。OpenTok API 似乎没有该功能。有什么方法可以以某种形式捕获数据并将其推送到另一个进行转录的脚本/工具?

问题不在于转录,问题在于访问实时音频流数据并实时使用它。

0 投票
0 回答
93 浏览

python - 他们有什么方法可以通过 python 和 librosa 转录大型音频文件吗?

我正在尝试通过这么多平台来做。首先,我尝试使用语音识别模块,但这不起作用。其次,我尝试使用 wit.ai,但它无法处理大文件。最后我尝试了aws transcribe,但我有一个学生帐户,所以我无法连接python ..