问题标签 [transcription]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2403 浏览

audio - 自动转录软件

我注意到最近一些Stack Overflow 播客的 wiki 转录有点弱。显然,这个任务需要一个计算机程序。将音频转录为文本(最好使用扬声器标签,以便我们知道谁说了什么)可以在软件中实现吗?是否有任何活跃的开源软件项目试图实现此类功能?

0 投票
1 回答
168 浏览

php - 存储视频和索引内容

如果有人有建议,请重新考虑:

我被要求创建或找到满足以下要求的系统...

1) 允许上传视频文件 - 当前解决方案:PHP 上传到 web 根目录上方的目录,然后我将在允许访问流之前验证用户。

2) 用视频中参与者的元信息标记文件(这些是调查),以便以后搜索。- 当前解决方案:关键字文本区域用“;”分隔项目 然后将项目解析为数据库中的“关键字”表以供稍后搜索。

3) 转录文本以便稍后进行全文搜索,因此如果参与者声明“我喜欢游泳、骑自行车、跑步”,那么稍后搜索“跑步”会找到这个结果(铁人三项可能会在元字段中输入) - 当前解决方案:使用服务进行转录。然后在全文索引字段中上传文本。

该信息将提供给订阅的客户,因此在上面的示例中,处理游泳、骑自行车、跑步的公司可能能够获得此结果,但冰淇淋供应商可能不会。- 当前解决方案:在注册和签入阶段为订阅者和视频分配类别。确保它们匹配。

似乎会有很多手动设置,所以如果有人对自动化或控制有更好的想法,请告诉我。

感谢您的建议。

0 投票
2 回答
70 浏览

php - 一些 php 到 ASP.NET

有好心人将此 php 转录为 ASP.NET 吗?

提前谢谢你。

jJ

0 投票
1 回答
2517 浏览

voice-recognition - Julius 的语音识别。如何制作 .voca 文件?

我正在制作一个语音识别系统,Julius 在这项工作中显示出不错的结果。示例 .voca 文件中的单词可以完美识别,但如何将自己的单词和转录内容放入文件中?

我已经尝试过 VoxForge ( http://www.voxforge.org/ ) 的最新版本,并使用他们的词汇表为声学模型进行夜间构建,但我在 julius 开始时遇到了很多错误,如下所示:

有人知道 .voca 文件的单词转录规则吗?

0 投票
3 回答
6349 浏览

php - 音频到文本 API?

是否有任何(免费)语音到文本 API 可以与 PHP 一起使用?(我只知道 PHP 和 html/css。)

我想给它发送一个音频文件,然后让它返回转录。

0 投票
5 回答
3541 浏览

java - Java 中 Wav 文件的音乐转录

我有一个关于使用 Java 进行音乐转录的项目,问题是,我创建了一个小程序,可以记录声音并将其保存到 WAV 文件中,播放器应该只播放他/她想要转录的作品,之后我就卡住了当时我必须从保存的 WAV 文件中获取信息并使用此信息创建 MIDI 文件,并且在创建 MIDI 文件后,我必须为其生成乐谱(乐谱),所有这些都必须完成在爪哇。

我到处寻找关于如何完成这些东西的清晰解释,但我没有找到任何直接的东西:(因为我是 Java 新手,我希望有人能帮我解决这个问题,我在编程时遇到问题的主题是:

  1. 获取有关在 WAV 文件中播放的音符的信息。
  2. 知道笔记。
  3. 创建与 WAV 文件等效的 MIDI 文件。
  4. 从 MIDI 文件生成 SCORE。

在对正在读取的数据执行分割后,我也尝试过快速傅立叶变换,但我认为这绝对是错误的方向:(

请如果有人可以在上面指定的主题上为我提供帮助,以及如何仅在 Java 中对这些主题进行编程,我们将不胜感激:)

顺便说一句,该项目是:
玩家在钢琴上弹奏音符>>记录他的演奏>>玩家获得他的演奏分数。

0 投票
2 回答
1614 浏览

speech-recognition - 使用 CMU 的 sphinx4 转录非数字数据

我最近正在使用 CMU 的 sphinx4 进行转录并最终强制对齐,即将音频与其转录对齐。

我找到了一个名为AutoCap的项目,它基本上完成了我想要开发的工作。所以,我安装了它,但它没有用。我尝试调整它,但我得到的只是不正确的时间戳。

所以,我想到了使用 sphinx4 并自己尝试一下。我使用 Sphinx 的 Transcriber.jar 文件成功转录了一个 wav 文件。但我无法让它适用于非数字数据的音频。自述文件页面指出“想要转录非数字数据的人应修改 config.xml 文件以使用正确的语法、语言模型和语言学家来执行此操作”

那么,任何人都可以为我提供一些帮助:

  • AutoCap
  • 使用 Sphinx4 转录非数字数据
  • 强制对齐

谢谢。

0 投票
0 回答
310 浏览

android - 如何在android中显示转录字符

我的 sqlite DB 数据上有转录字符,例如

但是有的在Android下不显示如何正确显示呢?我需要显示来自不同欧洲字母的其他特殊字符。

感谢您的时间!

解决了!!!如果有人感兴趣,您可以为 TextView 使用特殊字体,例如 Lucida Sans Unicode。

0 投票
1 回答
70 浏览

telephony - 转录电话录音

有某个组织定期在“热线”上以录音消息的形式提供信息。是否有任何开源解决方案(或可以“连接”在一起的一组组件)允许我在网页上以文本形式呈现这些信息?

0 投票
1 回答
225 浏览

android - 我应该为转录选择什么编码?

我和我的朋友正在开发适用于 iphone 和 android 的应用程序。我们需要处理单词转录。我们应该选择什么编码(甚至特殊字体)来在我们的应用程序中显示正确的单词转录?

更新(2011 年 12 月 14 日):我想提供更多信息。我尝试从 Muller 字典(http://sourceforge.net/projects/xdxf/files/dicts-XDXF/sdict05/comn_sdict_axm05_mueller24.tar.bz2/download)中阅读一些转录,但遇到了一些字符问题。我检查字典文件编码enca

一个有问题的词是“画家”。当我在 emacs 中打开字典文件时,我看到:

在此处输入图像描述

有了数据,我们的脚本用 ruby​​ 编写。它从字典中解析这个转录并存储在数据库中。之后,它从数据库中获取此转录并将其作为 json 写入文件(utf-8)。如果我在文本编辑器中打开此文件,我会将其视为此字符串\u0445peInt\u255a

如果我在我的应用程序中解析它并在屏幕上显示它看起来像这样:

在此处输入图像描述

错误在哪里?我想在解析字典文件时有这个问题。比如何正确解析它?