问题标签 [phonetics]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xcode - Xcode Accessibility Inspector (XIB):是否可以对 Label 使用拼音拼写?
我正在升级一个 iOS 应用程序以在 Xcode 中实现可访问性。我正在使用 Interface Builder 的 Accessibility Inspector 设置为视图启用 VoiceOver 功能的值。
输入 的值时Label
,使用拼音代替实际拼写是否可以接受(甚至是最佳实践)?
例子:
VoiceOver 会误读某些单词或产品名称。例如,“Waze”的发音不正确 - 我应该拼写“Ways”吗?或者“Nowait”拼写为“No wait”?还是“UltraOne”拼写为“Ultra one”?
另一个例子,应该输入缩写吗?例如,Ohio (OH) 的缩写发音为“Oh”而不是“Ohio”。
有时像“FAQs”这样的缩写发音为“facks”。我应该输入“常见问题解答”还是“常见问题解答”之类的内容?
截屏:
谢谢!
machine-learning - 如何学习双语系统的pocketsphinx?
我确实在一个文件中创建了一本包含 2 种语言(英语/波斯语)的字典,如下所示:
并使用http://www.speech.cs.cmu.edu/tools/lmtool-new.html构建语言模型。然后我尝试使用该语言模型学习声学模型并对其进行测试。
它适用于波斯语的声音,但不适用于英语单词。经过一些尝试和错误后,我发现问题出在我的手机上。正如您在上面看到的,我使用了自己的手机,但pocketsphinx 似乎不接受这个手机的英语单词,它只接受它自己的英语手机!
所以我想知道我发现问题是真的吗?我也应该使用pocketsphinx phoneset 来输入我的波斯语单词吗?我应该在哪里找到它的完整电话集和学习如何将其用于波斯语单词的指南?
java - 用对应的英文字母替换特殊字符
寻找一个实现或库(最好是在 Java 中),它将如下所示的Unicode文本转换为相应的ASCII英文字符:
ʀᴇɢɪꜱᴛʀᴀᴛɪᴏɴ
以下应转换为:
登记
但是请注意,还有其他可能要转换的字符,例如“cσdє”。
最终目标是进行phenetic/fuzzy match,但是我相信一旦字符是实际的 ASCII 英语,这将变得容易。
encoding - 国际音标 (IPA) 的这个 ACSII 表示系统是什么?
我正在处理一些字典文件,发现单词的 IPA 用 ACSII 字符表示。例如,“无聊”的国际音标是/ˈbɔrɪŋ/,而在字典文件中它记录为/5bC:rIN/。我提到了一些 ASCII-IPA,例如Kirshenbaum和X-SAMPA,但它们不是我想要的。你知道什么是表示系统吗?谢谢你。
macos - Macintosh 说文字转语音:新声音不能接受音素代码?
Mac 文本到语音转换工具中有几个很棒的新声音。对于较旧的声音,例如 Ralph,您可以像这样指定音素输入:
说 -v 拉尔夫 [[inpt PHON]]dIHv1EHlAXpAXr
(这里说的是“开发者”。)
但是,新的声音似乎不起作用。如果你用 Ava 尝试这个(比如 -v Ava [[inpt PHON]]dIHv1EHlAXpAXr),她会读出字母和数字的列表,就好像它只是一个字符串一样。有谁知道是否有可能获得新声音的细节?
谢谢!
solr - 如何在 solr 中实现语音搜索的突出显示?
这里的情况是,当我搜索一个词时,例如。xyz 它正确显示带有突出显示标签的字段,但对于其他人,例如。abc,即使该词是搜索字段值的一部分,它也不会突出显示。
问题是不一致。对于某些搜索词,它可以完美地突出显示,而对于其他搜索词则根本没有突出显示。例如。
这给出了非常好的突出显示结果,但是
这根本没有突出显示,尽管 content_phonetic 字段在同一行文本中包含两个单词。同样对于我正在使用的 beiderMorseFilter,“国家”将被索引为
和“原始”世界将被索引为
再次为“报告”,尽管索引词将是“报告”
最后一个也没有突出显示。
elasticsearch - 使用语音进行 Elasticsearch 后处理
我正在使用 Elasticsearch 以在生产环境中实现未来。我的问题是我需要使用模糊搜索和语音来实现我的目标,如下:
- 使用模糊匹配查询
- 结果非常好,即使在查询中弄乱了字符串:
- 当我没有索引艺术家和/或曲目时,问题就开始了:
- 结果没有返回贾斯汀比伯,因为它没有被索引
目标是了解艺术家和曲目是否被索引。我需要尽可能准确的结果,但仍然使用模糊性来掩盖拼写错误。
我的想法是使用带有 metaphone 的语音插件来对检索到的文档和输入字符串进行后处理,这样可以定义为文档生成的 metaphone 是否存在于输入字符串的 metaphone 上。我希望我可以提供一个查询,而 Elasticsearch 可以在同一结果集上返回所有这些信息,甚至告诉我是否找到了匹配项。
我只能使用语音字符串调用:
或者
这与我需要的相差甚远,因为我无法在同一字段中使用语音和模糊搜索:\
以下是语音分析器和过滤器的创建方式:
例如,我没有找到关于 Elasticsearch 的语音插件或如何在脚本上使用它的更详细资料(本例中的想法是对每个文档进行后处理并为每个标记生成语音,然后将它们与搜索字符串)。
我可以编写一个外部程序来接收和处理 Elasticsearch 的结果,但这太笨拙了,因为现在我有两个 API,一个调用另一个(我仍然需要通过 API 提供结果)。
总而言之,我需要确保对艺术家和曲目进行索引,但同时我需要接受拼写错误。
提前谢谢了。
cmusphinx - 在使用 cmusphinx 调整 AM 时,是否需要将更新的音素序列添加到 .dict 文件?
我正在尝试使用印度英语口音录音来调整 en-us 声学模型。由于许多单词以不同的口音发音,我是否需要添加单词的更新音素表示?目前我正在关注这个链接:https : //cmusphinx.github.io/wiki/tutorialadapt/#accumulating-observation-counts 这里没有提到更新你的 .dict 文件。
PS:我应该直接在字典中添加新单词吗?
apache-spark - 是否有火花库来查找句子中单词的语音匹配?
是否有火花库来查找句子中单词的语音匹配。例如:句子:“有人在滑板车上”。
要查找的单词:“两个”。
由于 to 和两个在语音上相似,它应该在句子中找到单词“to”的正匹配。
我找到了一个弹性搜索语音过滤器,它做类似的事情。但我正在寻找一种方法来做一个火花流集群。
sql-server - 如何识别 MS SQL 数据库表中的拼音字母
我们通过 sql server management studio 中的导入平面文件功能插入了超过 100000 条记录。已成功插入。但是某些列值包含 é 和 ö 等字符。它在将上述所有字符(如(ö,é)存储在 sql 列中时转换为。
此外,下面的 SQL 语句没有给出任何结果。
表格中带有这些字符的数据以符号(菱形中的问号)显示。
请帮助我如何插入数据以保持 phoentic 符号完整。