问题标签 [phonetics]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
search - 搜索用户名的语音算法
我让 DynamoDB 存储用户配置文件。这里的主键是一个 id。密钥必须是 id。用户配置文件包含诸如他的用户名、一组朋友等信息......所以现在这是第一个问题:用户 A 想通过他的名字搜索用户 B。每次发生这种情况时,我都不想进行完整的 DynamoDB 扫描。因为我已经有了一个 redis 服务器,所以我可以在那里存储用户名-id-pairs。
所以现在真正的问题是:我要搜索什么?例如,我的用户名可能是 Eric1996。我的一个朋友不记得最后一位数字,所以他只搜索 Eric19。或者也许他只是忘记了开头的大写字母并搜索了 eric1996。在另一种情况下,他可能会拼错名称,例如 erik1996、erick1996、erich1996。
我稍微搜索了那个主题,并了解到有一种叫做语音算法的东西,它可以根据单词的发音来搜索单词。这将修复上面的示例。但是这样的算法也适用于其他用户名吗?您现在有些用户想出了真正的 3x0tic 名称,或者只是使用随机字母。我认识一个在网上自称是 dadddddx__7 的人。我认为这比拼写纠正器要困难得多,因为用户可能有一个故意拼错的名字
javascript - 拼音字符转换在 google chrome 和 safari 中无法正常工作
我正在使用拼音字符在ckeditor中将英语转换为我的本地语言,但它在google chrome和safari中无法正常工作这是我的代码
但它在 Firefox 中工作,我可以在 chrome 中阅读所有浏览器中的文本,safari 字符不会绑定到单词。
ckeditor - 任何人都有与 ckeditor 一起使用的 URDU 语言 js 库?
任何人都有与 ckeditor 一起使用的 URDU 语言 JS 库?我可以付钱给他,我非常需要那个图书馆。我使用了这个库http://ckeditor.com/forums/Plugins/Urdu-input
,它在 Mozilla 中工作,但在 chrome 中不起作用,在 chrome 中它显示字符但不显示单词。
c# - 如何在 C# 中使用 System.Speech 获取原始语音数据?
我想知道如何从 C# 中的 System.Speech 获取原始语音数据。
世界或句子识别效果很好,但它被“解释”以给出一个连贯且语法正确的句子。我不想要那个;我正在寻找一种无需翻译即可将音频翻译成语音的方法。
python - 使用Python检测两个单词是否押韵
首先,我对 Python(和一般编程)非常陌生,
我正在寻找编写一个程序来检测两个特定音节(字符串)是否在语音上押韵。我已经尝试过“发音”模块,但它通常只检查完美的押韵(例如“cat”和“hat”)。但是,不会检测到基于语音的押韵,例如“poor”和“pour”或“poor”和“tour”。
我编写了以下程序,它基本上将一系列单词作为输入,对它们进行音节化,将这些音节排列为数组中的行和列,并根据模块“交叉检查”数组中的每个条目是否押韵“发音”; 如果是这种情况则返回 1,否则返回 0。
例如,输入
将输出数组
这是目前的代码:
在这种情况下,输出数组的原因是无关紧要的,因为我只想优化程序中检查韵律的部分。
你会如何解决这个问题?您将如何编写一个可以检测音韵而不会出现太多误报的程序?
phonetics - 在 praat 脚本中查找多个单词
我正在编写一个 praat 脚本,它将在多个文件中搜索单词列表。这就是我到目前为止所拥有的。它只放大到过程中的第一个单词,而不遍历其余单词。我认为这与选择的内容有关。对于For i through n
,仅选择了文本网格,但随后在注释器中,两者都被选中。我需要脚本继续搜索每个间隔,以便也可以找到过程中的其他单词。
编辑:这是根据答案修改后的脚本。
javascript - 语音识别
我正在尝试获得我需要的拉丁语语音识别,. . . 不是单词识别,而是。. . 语音元音和辅音识别(因为拉丁语只有 40 个声音,但超过 40,000 个单词 x 60 平均结尾 = 250 万个单词形式)。问题是, 。. . Web Speech API和Google Cloud Speech都只是从听起来相似的完整单词开始(并且也从英语语法开始,因为那里没有 250 万单词的拉丁语法),所以我没有办法开始处理实际的语音,特别是词干(单词的前半部分),它区分每个单词,而不是(对我来说)无用的词尾告诉它在句子中的作用。理想情况下,我想要一个词干的语法,例如
- “am-”( amo、 amare、amavi、amatus 等的缩写),
- "vid-" ( video, videre ,vidi,visus等的缩写),
“laet-”(laetus、laeta、laetum 等的缩写)
等等
但语音识别技术无法搜索到这一点。
那么我在哪里可以获得语音语音识别?
我更喜欢 jS、pHp 或 Node,最好是客户端,而不是流式传输。
到目前为止,这是我的代码,用于Web Speech API。关键是console.log()
s 表明我试图深入研究每个返回的可能单词的属性:
python - 如何在子串级别生成同音字?
我想以编程方式生成单词的同音字。含义,听起来与原始单词相似的单词。
我遇到了Soundex算法,但它只是用其他字符替换了一些字符(比如 t 而不是 d)。有没有更复杂的列表或算法,至少提供同音字子串?
重要提示:我想将此应用于字典中没有的单词,这意味着我不能依赖整个真实的单词。
编辑:
输入是一个字符串,通常是一个专有名称,因此在标准(同音字)字典中不存在。一个例子可能是谷歌或麦当劳(仅举两个流行的命名实体,但许多更不受欢迎)。
然后输出是该字符串的(随机)同音字。由于单词通常有多个同音字,因此我的目标是单个(随机)一个。在Google的例子中,同音字可能是gugel,或者MacDonald's代表McDonald's。
javascript - Python 到 js 单词到语音脚本
有没有办法在javascript中做到这一点?
(在数组中搜索字符串,返回该字符串的索引,然后console.log(bArray[location];
)