“phonetics”的相关标签问题

0 投票

1 回答

170 浏览

search - Microsoft FHIR - 搜索名称

我们在 Cosmos 数据库上运行 Microsoft FHIR 服务器，并且最近在 git-hub 上将我们的代码更新到了最新版本。更新后，搜索患者、从业者和人员的姓名似乎已更改。早些时候，无论搜索的字符串是给定的还是姓氏，都可以搜索 name= 并查找文档。在新版本中，我必须专门搜索给定名称。这是故意的吗？为了使搜索像以前一样工作，我们需要做些什么吗？

同样，早先搜索组织名称允许我们在名称中间进行搜索并查找文档。在新版本中，搜索只查找以搜索条件开头的组织名称。这是故意的吗？为了使搜索像以前一样工作，我们需要做些什么吗？

使用拼音搜索姓名的计划是什么？它在 FHIR 中可用，但到目前为止我还无法确定它是否在 Microsoft FHIR 服务器中实现以及它是如何工作的。

2020-03-18T10:33:41.273

0 投票

1 回答

721 浏览

elasticsearch - 如何决定在 Elasticsearch“语音令牌过滤器”中为哪种语言使用哪个编码器？

我在 Elasticsearch 中使用了带有“Phonetic Token Filter”的Metaphone和soundex编码器。

Metaphone适合英语单词。

Soundex适用于英语以及印地语，也许还有许多其他语言。

我想知道哪些编码器最适合印地语以及其他印度语言（如果可能）？

声讯
变音器
双变位音
精炼的_soundex
caverphone1 - 英语（新西兰本地化）
caverphone2 - 英语（新西兰本地化）
科隆 - 德语
nysiis - 即兴的 Soundex
koelnerphonetik - 德语
haasephonetik - 德语
beider_morse - 英语和多种欧洲语言
daitch_mokotoff - 斯拉夫和意第绪语姓氏

由于Elasticsearch 网站上没有列出我们应该为哪种语言选择哪种编码器。

还请告诉我您已经使用了哪些编码器以及用于哪种语言。

elasticsearch phonetics metaphone

2020-03-28T05:24:42.363

0 投票

4 回答

4846 浏览

python - 如何获得文本（不是语音，只有文本）的发音（语音）？

我想使用 python 获得短信的发音。例如，消息“text”应转换为“tekst”，消息“привет”（俄语）应转换为“privet”。

我曾尝试使用googletrans，但实际上没有发音（发音是 None，我的问题）。

有人知道这个任务的一些包吗？我已经用谷歌搜索了它，但没有结果。我找到了超过 5 个用于将文本转换为语音或文本翻译为语音的包，但我不需要音频文件，我只需要发音文本。phonemizer是非常好的解决方案，但我无法在 Windows 上运行它的后端。

也许有人知道如何获取这个、这个或这个或这个的一些“API”吗？

python text-to-speech google-text-to-speech google-translation-api phonetics

2020-05-24T14:38:08.513

0 投票

1 回答

77 浏览

python - 如何计算来自不同列的两个字符串之间的归一化编辑相似度

我正在尝试使用 python 计算两个字符串之间的归一化 editex 相似度。到目前为止，我已经使用此代码来获取运行良好的原始 editex 距离：

我在这里阅读了文档：https ://anhaidgroup.github.io/py_stringmatching/v0.3.x/Editex.html

但是，当我尝试：

我得到错误：

AttributeError: ("'Editex' 对象没有属性 'get_sim_score'", '发生在索引 0')

我不完全确定这里出了什么问题，所以任何帮助将不胜感激！

python attributeerror fuzzy-comparison phonetics

2020-06-17T11:12:25.807

0 投票

0 回答

41 浏览

r - R 中的主效应没有 F & P 值

我正在使用aovR 运行重复测量方差分析，所有变量都在受试者内。但是 R 没有显示出主要影响。有几个人看过我的代码，没有人知道为什么。看起来像：

但是当我运行时summary(test1)，我只得到一个 P 值：

对于主要效果a, b, c，我只得到Df Sum Sq Mean Sq.

我也尝试切换到"afex"，并这样做：

但是随后的摘要不允许我进行复杂的交互，例如a*b+c. 并非所有变量都在我的模型中相互作用。我需要两个交互，但我必须控制另一个的主要效果。

r statistics anova linguistics phonetics

user9529062

2020-06-22T07:47:03.367

0 投票

1 回答

57 浏览

r - LMER 测试从哪里来的相同错误？

我正在尝试对数据集（附加原始数据）执行 LMER 测试，所有列的行数相同（153）。但是，当我尝试拟合公式时，它给了我一个错误

错误：每个分组因子的级别数必须 < 观察次数（问题：文件名）

即使我更改了固定和随机因素，错误仍然保持不变。“文件名”列指定说话者，“V1”、“C2”和“V2”列是“文件名”列中说话者说出的测试词中辅音和元音的持续时间。

试图寻找解决方案，但找不到任何帮助，尽管错误并不少见。

我的数据：

r lme4 linguistics phonetics

2020-10-25T08:33:44.603

0 投票

0 回答

29 浏览

r - 这是对数据框进行排序以在 ANOVA (aov) 中获得合理结果的正确方法吗？

我（理论上）了解如何解释方差分析的结果。我也知道这里提供的格式在执行 LMER 测试时是可以的，但由于样本量很小，我仅限于 Anova。

基本上，我想看看C2.dn当“辅音”列的值为“单例”或“双联”时，变量的持续时间值是否显示任何持续时间差异？同样，如果V1.dn和V2.dn显示任何持续时间差异？通过比较音素的方式，我已经确认这些确实如此。环境。

例如，这里的单词 chape, chappe (Row 1,2, Col 'Filename') 是最小的对，其中V1_xsampa表示元音 [a/@]，C2_xsampa表示辅音 [p] 或 [p:]，并V2_xsampa表示词尾 [e :]。所有这些音素在它们各自的列 ( V1.dn, C2.dn, V2.dn) 中都有它们的数字（持续时间）值。

我希望我能清楚地理解。我是 R 的新手。任何帮助都会很棒。

这是我的部分数据：

编辑：

头（df）

文件名说话者辅音位置方式发声前元音性别 V1.dn V1_xsampa C2.dn C2_xsampa 1 AK_chape.TextGrid 1 Singleton Bilabial Stop Voiceless Short F 8.190506 @ 8.004261 p 2 AK_chappe.TextGrid 1 Geminate Bilabial Stop Voiceless Short F 7.469901 @ 16.455435 p: TextGrid 1 Singleton Retroflex Stop 清音短 F 5.798567 @ 8.422198 t 4 AK_fatti.TextGrid 1 Geminate Retroflex Stop Voiceless Short F 5.883851 @ 15.216855 t: 5 AK_katha.TextGrid 1 Singleton Dental/alveolar Stop Voiceless Short F 7.447716 @ 8.711895 t_d_h 6 AK_kute.TextGrid 1 Singleton Dental/alveolar Stop Voiceless Short F 7.360776 U 7.360776 t_d V2.dn V2_xsampa V1_dn C2_dn V2_dn 1 12.43744 e: 0.08190506 0.08004261 0.1243744 2 11.58376 e: 0.07469901 0.16455435 0.1158376 3 12.34388 i: 0.05798567 0.08422198 0.1234388 4 10.27983 i: 0.05883851 0.15216855 0.1027983 5 11.38643 A: 0.07447716 0.08711895 0.1138643 6 13.46687 e: 0.07360776 0.07360776 0.1346687

EDIT2： 输入（头（df））

文件名说话者辅音位置方式发声前元音性别 V1.dn V1_xsampa C2.dn C2_xsampa 1 AK_chape.TextGrid 1 Singleton Bilabial Stop Voiceless Short F 8.190506 @ 8.004261 p 2 AK_chappe.TextGrid 1 Geminate Bilabial Stop Voiceless Short F 7.469901 @ 16.455435 p: TextGrid 1 Singleton Retroflex Stop 清音短 F 5.798567 @ 8.422198 t 4 AK_fatti.TextGrid 1 Geminate Retroflex Stop Voiceless Short F 5.883851 @ 15.216855 t: 5 AK_katha.TextGrid 1 Singleton Dental/alveolar Stop Voiceless Short F 7.447716 @ 8.711895 t_d_h 6 AK_kute.TextGrid 1 Singleton Dental/alveolar Stop Voiceless Short F 7.360776 U 7.360776 t_d V2.dn V2_xsampa V1_dn C2_dn V2_dn 1 12.43744 e: 0.08190506 0.08004261 0.1243744 2 11.58376 e: 0.07469901 0.16455435 0.1158376 3 12.34388 i: 0.05798567 0.08422198 0.1234388 4 10.27983 i: 0.05883851 0.15216855 0.1027983 5 11.38643 A: 0.07447716 0.08711895 0.1138643 6 13.46687 e: 0.07360776 0.07360776 0.1346687

r anova linguistics phonetics

2020-11-12T14:58:58.380

0 投票

1 回答

222 浏览

java - 为什么Java的Double Metaphone只给出四个字母代码？

我想使用 DoubleMetaphone 来获取给定字符串的语音编码。例如：

结果：计算机 -> KMPT

当我尝试对更长的字符串进行编码时，就会出现问题。

结果：dustinhoffmanisanactor -> TSTN

显然，它正在使用前 4 个编码字符并停止。在这种情况下，达斯汀 -> TSTN。

我使用了 Double Metaphone 的 Python 实现，它按预期工作。

java codec phonetics metaphone

2020-11-14T22:54:20.317

0 投票

1 回答

54 浏览

r - 删除数据框中的非配对条目？

我的数据框“df”中的“辅音”列有两个数字级别，“Geminate”为 250，“Singleton”为 214。因为 Geminates 的数量更多，我怎样才能删除 Geminates 的额外条目，从而等同于“Singleton”？输出应该是只有那些“Geminate”的条目应该保留在“Singleton”中有对应的条目。“文件名”列中的前两个字符表示说话者，然后是测试的标记词。

我的数据框有 13 列和 464 行，因此，张贴图片（知道不鼓励这样做）。在此先感谢您的帮助。问候。

我的数据框的片段

编辑： dput() 的输出在提供的链接中（因为我无法在此处粘贴它，超过了字符限制）。 dput() 输出

r sorting linguistics phonetics

2020-11-17T03:05:46.723

0 投票

0 回答

20 浏览

python - 语音字符到语音

我想在我的应用程序中为低级语言添加“文本到语音”的功能（例如：普什图语，...）

.NET 中有一个库

python中是否存在用于执行此活动的引擎？我想知道python是否存在“语音字符到语音”引擎？

python text-to-speech phonetics

2020-12-03T02:51:30.307

问题标签 [phonetics]

Reference