问题标签 [phonetics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1586 浏览

hibernate - Hibernate Search 中的同义词分析器和语音分析器

有人知道如何使用语音分析器和同义词分析器。我没有找到一个很好的教程来解释这一点??

0 投票
3 回答
1125 浏览

database - Soundex 有改进吗?

Soundex 似乎在某些 DBMS 中实现了,但是否有任何算法改进明确优于 Soundex 的当前实现?

0 投票
3 回答
2332 浏览

unicode - 比较不同语言的短字符串以获得相似的声音 - Soundex 是答案吗?

我如何才能为用一种语言编写的字符串与另一种语言的另一种字符串获得声音相似度“评级”:即一种可以识别该字符串的算法

David Letterman ”和“ דוד לטרמן ”是听起来相似的字符串。

-哦,是的,顺便说一句,上面是希伯来语,你猜对了:“大卫莱特曼”,它的发音/口语几乎与英语相同..

我拥有的唯一原材料是各自语言的 unicode 字符串。也就是说,我没有字符串的音素或音标/翻译。

我已经实现了一个 Soundex 实现调整,效果一般。这是要走的路吗?

0 投票
1 回答
5194 浏览

r - 包含R中给定点百分比的椭圆

我正在绘制 F1/F2 元音图(这里有一个例子)。每个元音都有几个点/值,我想在这些点周围画一个椭圆,这样:

  • 椭圆覆盖至少 80% 的点(即上图中的“i”有几个值,但它们都包含在椭圆内)。
  • 位于最小值/最大值的方向上。

我可能会让事情复杂化,但三角学和数学对我来说是希腊语。以下是我尝试过的。

椭球体()

Ellipsoidhull()在包包“cluster”中。如果我将具有 F1 和 F2 的矩阵传递给函数,它似乎会计算椭圆的中心,但方向值很大。例如:

如果传递给ellipsoidhull

我想弄清楚如何绘制椭圆并不难,但是“形状矩阵”(最大/最小半径值?)太高了。顺便说一句,感谢 Freednode 上的#R 提供的提示。

来自 EMU-R 的源代码

然后,我查看了 EMU-R 的代码,R 包与EMU一起工作,除其他外,它可以用椭圆体绘制 F1/F2。似乎这样做的代码在这里,但我不明白椭圆是如何绘制的。

任何帮助表示赞赏。

0 投票
2 回答
20856 浏览

text-to-speech - 是否有接受基于 IPA 的音标的文本转语音软件?

我想将语音文本 (IPA) 翻译成合成语音。我发现没有 TTS 软件可以做到这一点,我也找不到任何其他软件。任何提示?这在理论上是否可行,质量不错,还是语音文本(在这种情况下为 IPA)不够好?

Loquendo 的 TTS 支持阅读拼音文字,但效果很差。我将联系他们的支持以获得一些帮助。

0 投票
1 回答
1454 浏览

html - 元标签:拉丁和非拉丁字母网站的标题和描述

我有(我相信)一个独特的情况;有点谜。这是交易。

情况:我有一个单一语言的网站,其中所有内容(内容、链接)都是非拉丁字符。(西里尔文)(utf-8)

该网站旨在连接全球阅读/讲俄语的人。

问题是很多人(大约 70%)使用拉丁字母输入俄语搜索词。例如:“novaja mashina”,在英语中是什么意思,但在俄语中是“新车”的意思。

我的任务是构建主页的标题和 Meta tag=description,所以如果可能的话,我可以用一块石头杀死两只鸟,这意味着可以容纳拥有并将使用西里尔文键盘并用西里尔文输入搜索词的人以及将使用的人构建俄语单词的拉丁字母仍然可以找到我的网站。

我的解决方案(我相信很糟糕)是简单地在标题标签中一个接一个地堆叠拉丁文和西里尔文,并在 meta=description 中相同。

  • 这完全是个坏主意吗?

如果不

  • 搜索引擎机器人/爬虫会忽略用英语写的俄语单词吗?
  • 如果我这样做,谷歌或其他搜索引擎会感到困惑或对排名产生负面影响。
  • 用英文写标题和元描述也是一个好主意吗?
  • 谷歌会考虑标题太长并惩罚我吗?(西里尔语+拉丁语-俄语+英语相同的东西3次最终会有点长的标题)

有人可以分享一个更聪明/更好的解决方案吗?

先感谢您!!!

0 投票
1 回答
1175 浏览

macos - 在 OSX 上等效的 MS SAPI sdk

我正在寻找一个可以让我在 OSX 应用程序上进行语音识别的 SDK。

我已经有一个使用 sapi 的 windows 工作代码,用于从音频文件中获取语音识别信息,我想看看如何在 osx 中执行此操作,因为 SAPI 之类的东西不可用。

谢谢!

0 投票
3 回答
246 浏览

perl - 什么是用于各种人类语言的语音表示的好包?

我目前正在开展一个项目,我认为能够提出各种语言的单词的语音表示会非常有帮助。我知道 Aspell 做得很好,但我不认为有一个非常简单的方法来获取他们的语音表示,所以我问:有没有其他好的包来获取给定单词和语言的单词的语音表示/方言/口音/不管它来自哪里?

这不需要使用任何特定的语言,但如果是 Perl,那将是最好的。

我已经尝试过 Soundex、Metaphone、DoubleMetaphone 和Text::Phonetic中的所有其他东西,但这些东西都不是很好——绝对远不及 Aspell 中的东西。

0 投票
2 回答
3157 浏览

perl - 如何在给定一个输入单词的情况下生成发音相似的单词列表?

当您在 Google 中拼错一个单词时(例如“apples”),它会为您提供现在熟悉的“Did you mean: apples ”建议。

排除 Google 根据搜索结果的相关性猜测您的意图的能力,我如何开发一个听起来相同的单词列表?

这些词不必是英语,也不必存在。因此,例如,如果我输入“hole”,我会得到一个列表,其中包括:“whole”“hola”“whore”“role”“molar”等......

我猜网上可能有一些东西可以开发这个列表,但我找不到任何东西。如果没有站点并且可以使用 Perl 完成,是否有 CPAN 模块可以帮助我做到这一点?

0 投票
1 回答
960 浏览

c# - 如何将阿拉伯语文本转换为 SAMPA 语音?

我们正在制作一个需要说阿拉伯语的项目,并且我们找到了一个开源工具Mbrola 项目,它可以做到这一点。

但是,我还需要一些方法将阿拉伯文本转换为 SAMPA 语音。那么有人可以帮我将阿拉伯语文本转换为 SAMPA 语音吗?