问题标签 [phonetics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
170 浏览

search - Microsoft FHIR - 搜索名称

我们在 Cosmos 数据库上运行 Microsoft FHIR 服务器,并且最近在 git-hub 上将我们的代码更新到了最新版本。更新后,搜索患者、从业者和人员的姓名似乎已更改。早些时候,无论搜索的字符串是给定的还是姓氏,都可以搜索 name= 并查找文档。在新版本中,我必须专门搜索给定名称。这是故意的吗?为了使搜索像以前一样工作,我们需要做些什么吗?

同样,早先搜索组织名称允许我们在名称中间进行搜索并查找文档。在新版本中,搜索只查找以搜索条件开头的组织名称。这是故意的吗?为了使搜索像以前一样工作,我们需要做些什么吗?

使用拼音搜索姓名的计划是什么?它在 FHIR 中可用,但到目前为止我还无法确定它是否在 Microsoft FHIR 服务器中实现以及它是如何工作的。

0 投票
1 回答
721 浏览

elasticsearch - 如何决定在 Elasticsearch“语音令牌过滤器”中为哪种语言使用哪个编码器?

我在 Elasticsearch 中使用了带有“Phonetic Token Filter”的Metaphonesoundex编码器。

Metaphone适合英语单词。

Soundex适用于英语以及印地语,也许还有许多其他语言

我想知道哪些编码器最适合印地语以及其他印度语言(如果可能)?

  • 声讯
  • 变音器
  • 双变位音
  • 精炼的_soundex
  • caverphone1 - 英语(新西兰本地化)
  • caverphone2 - 英语(新西兰本地化)
  • 科隆 - 德语
  • nysiis - 即兴的 Soundex
  • koelnerphonetik - 德语
  • haasephonetik - 德语
  • beider_morse - 英语和多种欧洲语言
  • daitch_mokotoff - 斯拉夫和意第绪语姓氏

由于Elasticsearch 网站上没有列出我们应该为哪种语言选择哪种编码器。

还请告诉我您已经使用了哪些编码器以及用于哪种语言。

0 投票
4 回答
4846 浏览

python - 如何获得文本(不是语音,只有文本)的发音(语音)?

我想使用 python 获得短信的发音。例如,消息“text”应转换为“tekst”,消息“привет”(俄语)应转换为“privet”。

我曾尝试使用googletrans,但实际上没有发音(发音是 None,我的问题)。

有人知道这个任务的一些包吗?我已经用谷歌搜索了它,但没有结果。我找到了超过 5 个用于将文本转换为语音或文本翻译为语音的包,但我不需要音频文件,我只需要发音文本。phonemizer是非常好的解决方案,但我无法在 Windows 上运行它的后端

也许有人知道如何获取这个这个这个这个的一些“API”吗?

0 投票
1 回答
77 浏览

python - 如何计算来自不同列的两个字符串之间的归一化编辑相似度

我正在尝试使用 python 计算两个字符串之间的归一化 editex 相似度。到目前为止,我已经使用此代码来获取运行良好的原始 editex 距离:

我在这里阅读了文档:https ://anhaidgroup.github.io/py_stringmatching/v0.3.x/Editex.html

但是,当我尝试:

我得到错误:

AttributeError: ("'Editex' 对象没有属性 'get_sim_score'", '发生在索引 0')

我不完全确定这里出了什么问题,所以任何帮助将不胜感激!

0 投票
0 回答
41 浏览

r - R 中的主效应没有 F & P 值

我正在使用aovR 运行重复测量方差分析,所有变量都在受试者内。但是 R 没有显示出主要影响。有几个人看过我的代码,没有人知道为什么。看起来像:

但是当我运行时summary(test1),我只得到一个 P 值:

对于主要效果a, b, c,我只得到Df Sum Sq Mean Sq.

尝试切换到"afex",并这样做:

但是随后的摘要不允许我进行复杂的交互,例如a*b+c. 并非所有变量都在我的模型中相互作用。我需要两个交互,但我必须控制另一个的主要效果。

0 投票
1 回答
57 浏览

r - LMER 测试从哪里来的相同错误?

我正在尝试对数据集(附加原始数据)执行 LMER 测试,所有列的行数相同(153)。但是,当我尝试拟合公式时,它给了我一个错误

错误:每个分组因子的级别数必须 < 观察次数(问题:文件名)

即使我更改了固定和随机因素,错误仍然保持不变。“文件名”列指定说话者,“V1”、“C2”和“V2”列是“文件名”列中说话者说出的测试词中辅音和元音的持续时间。

试图寻找解决方案,但找不到任何帮助,尽管错误并不少见。

我的数据:

0 投票
0 回答
29 浏览

r - 这是对数据框进行排序以在 ANOVA (aov) 中获得合理结果的正确方法吗?

我(理论上)了解如何解释方差分析的结果。我也知道这里提供的格式在执行 LMER 测试时是可以的,但由于样本量很小,我仅限于 Anova。

基本上,我想看看C2.dn当“辅音”列的值为“单例”或“双联”时,变量的持续时间值是否显示任何持续时间差异?同样,如果V1.dnV2.dn显示任何持续时间差异?通过比较音素的方式,我已经确认这些确实如此。环境。

例如,这里的单词 chape, chappe (Row 1,2, Col 'Filename') 是最小的对,其中V1_xsampa表示元音 [a/@],C2_xsampa表示辅音 [p] 或 [p:],并V2_xsampa表示词尾 [e :]。所有这些音素在它们各自的列 ( V1.dn, C2.dn, V2.dn) 中都有它们的数字(持续时间)值。

我希望我能清楚地理解。我是 R 的新手。任何帮助都会很棒。

这是我的部分数据:

编辑:

头(df)

文件名 说话者 辅音 位置 方式 发声 前元音 性别 V1.dn V1_xsampa C2.dn C2_xsampa 1 AK_chape.TextGrid 1 Singleton Bilabial Stop Voiceless Short F 8.190506 @ 8.004261 p 2 AK_chappe.TextGrid 1 Geminate Bilabial Stop Voiceless Short F 7.469901 @ 16.455435 p: TextGrid 1 Singleton Retroflex Stop 清音短 F 5.798567 @ 8.422198 t 4 AK_fatti.TextGrid 1 Geminate Retroflex Stop Voiceless Short F 5.883851 @ 15.216855 t: 5 AK_katha.TextGrid 1 Singleton Dental/alveolar Stop Voiceless Short F 7.447716 @ 8.711895 t_d_h 6 AK_kute.TextGrid 1 Singleton Dental/alveolar Stop Voiceless Short F 7.360776 U 7.360776 t_d V2.dn V2_xsampa V1_dn C2_dn V2_dn 1 12.43744 e: 0.08190506 0.08004261 0.1243744 2 11.58376 e: 0.07469901 0.16455435 0.1158376 3 12.34388 i: 0.05798567 0.08422198 0.1234388 4 10.27983 i: 0.05883851 0.15216855 0.1027983 5 11.38643 A: 0.07447716 0.08711895 0.1138643 6 13.46687 e: 0.07360776 0.07360776 0.1346687

EDIT2: 输入(头(df))

文件名 说话者 辅音 位置 方式 发声 前元音 性别 V1.dn V1_xsampa C2.dn C2_xsampa 1 AK_chape.TextGrid 1 Singleton Bilabial Stop Voiceless Short F 8.190506 @ 8.004261 p 2 AK_chappe.TextGrid 1 Geminate Bilabial Stop Voiceless Short F 7.469901 @ 16.455435 p: TextGrid 1 Singleton Retroflex Stop 清音短 F 5.798567 @ 8.422198 t 4 AK_fatti.TextGrid 1 Geminate Retroflex Stop Voiceless Short F 5.883851 @ 15.216855 t: 5 AK_katha.TextGrid 1 Singleton Dental/alveolar Stop Voiceless Short F 7.447716 @ 8.711895 t_d_h 6 AK_kute.TextGrid 1 Singleton Dental/alveolar Stop Voiceless Short F 7.360776 U 7.360776 t_d V2.dn V2_xsampa V1_dn C2_dn V2_dn 1 12.43744 e: 0.08190506 0.08004261 0.1243744 2 11.58376 e: 0.07469901 0.16455435 0.1158376 3 12.34388 i: 0.05798567 0.08422198 0.1234388 4 10.27983 i: 0.05883851 0.15216855 0.1027983 5 11.38643 A: 0.07447716 0.08711895 0.1138643 6 13.46687 e: 0.07360776 0.07360776 0.1346687

0 投票
1 回答
222 浏览

java - 为什么Java的Double Metaphone只给出四个字母代码?

我想使用 DoubleMetaphone 来获取给定字符串的语音编码。例如:

结果:计算机 -> KMPT

当我尝试对更长的字符串进行编码时,就会出现问题。

结果:dustinhoffmanisanactor -> TSTN

显然,它正在使用前 4 个编码字符并停止。在这种情况下,达斯汀 -> TSTN。

我使用了 Double Metaphone 的 Python 实现,它按预期工作。

0 投票
1 回答
54 浏览

r - 删除数据框中的非配对条目?

我的数据框“df”中的“辅音”列有两个数字级别,“Geminate”为 250,“Singleton”为 214。因为 Geminates 的数量更多,我怎样才能删除 Geminates 的额外条目,从而等同于“Singleton”?输出应该是只有那些“Geminate”的条目应该保留在“Singleton”中有对应的条目。“文件名”列中的前两个字符表示说话者,然后是测试的标记词。

我的数据框有 13 列和 464 行,因此,张贴图片(知道不鼓励这样做)。在此先感谢您的帮助。问候。

我的数据框的片段

编辑: dput() 的输出在提供的链接中(因为我无法在此处粘贴它,超过了字符限制)。 dput() 输出

0 投票
0 回答
20 浏览

python - 语音字符到语音

我想在我的应用程序中为低级语言添加“文本到语音”的功能(例如:普什图语,...)

.NET 中有一个库

python中是否存在用于执行此活动的引擎?我想知道python是否存在“语音字符到语音”引擎?