问题标签 [phonetics]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
search - Microsoft FHIR - 搜索名称
我们在 Cosmos 数据库上运行 Microsoft FHIR 服务器,并且最近在 git-hub 上将我们的代码更新到了最新版本。更新后,搜索患者、从业者和人员的姓名似乎已更改。早些时候,无论搜索的字符串是给定的还是姓氏,都可以搜索 name= 并查找文档。在新版本中,我必须专门搜索给定名称。这是故意的吗?为了使搜索像以前一样工作,我们需要做些什么吗?
同样,早先搜索组织名称允许我们在名称中间进行搜索并查找文档。在新版本中,搜索只查找以搜索条件开头的组织名称。这是故意的吗?为了使搜索像以前一样工作,我们需要做些什么吗?
使用拼音搜索姓名的计划是什么?它在 FHIR 中可用,但到目前为止我还无法确定它是否在 Microsoft FHIR 服务器中实现以及它是如何工作的。
elasticsearch - 如何决定在 Elasticsearch“语音令牌过滤器”中为哪种语言使用哪个编码器?
我在 Elasticsearch 中使用了带有“Phonetic Token Filter”的Metaphone和soundex编码器。
Metaphone适合英语单词。
Soundex适用于英语以及印地语,也许还有许多其他语言。
我想知道哪些编码器最适合印地语以及其他印度语言(如果可能)?
- 声讯
- 变音器
- 双变位音
- 精炼的_soundex
- caverphone1 - 英语(新西兰本地化)
- caverphone2 - 英语(新西兰本地化)
- 科隆 - 德语
- nysiis - 即兴的 Soundex
- koelnerphonetik - 德语
- haasephonetik - 德语
- beider_morse - 英语和多种欧洲语言
- daitch_mokotoff - 斯拉夫和意第绪语姓氏
由于Elasticsearch 网站上没有列出我们应该为哪种语言选择哪种编码器。
还请告诉我您已经使用了哪些编码器以及用于哪种语言。
python - 如何计算来自不同列的两个字符串之间的归一化编辑相似度
我正在尝试使用 python 计算两个字符串之间的归一化 editex 相似度。到目前为止,我已经使用此代码来获取运行良好的原始 editex 距离:
我在这里阅读了文档:https ://anhaidgroup.github.io/py_stringmatching/v0.3.x/Editex.html
但是,当我尝试:
我得到错误:
AttributeError: ("'Editex' 对象没有属性 'get_sim_score'", '发生在索引 0')
我不完全确定这里出了什么问题,所以任何帮助将不胜感激!
r - R 中的主效应没有 F & P 值
我正在使用aov
R 运行重复测量方差分析,所有变量都在受试者内。但是 R 没有显示出主要影响。有几个人看过我的代码,没有人知道为什么。看起来像:
但是当我运行时summary(test1)
,我只得到一个 P 值:
对于主要效果a, b, c
,我只得到Df Sum Sq Mean Sq
.
我也尝试切换到"afex"
,并这样做:
但是随后的摘要不允许我进行复杂的交互,例如a*b+c
. 并非所有变量都在我的模型中相互作用。我需要两个交互,但我必须控制另一个的主要效果。
r - LMER 测试从哪里来的相同错误?
我正在尝试对数据集(附加原始数据)执行 LMER 测试,所有列的行数相同(153)。但是,当我尝试拟合公式时,它给了我一个错误
错误:每个分组因子的级别数必须 < 观察次数(问题:文件名)
即使我更改了固定和随机因素,错误仍然保持不变。“文件名”列指定说话者,“V1”、“C2”和“V2”列是“文件名”列中说话者说出的测试词中辅音和元音的持续时间。
试图寻找解决方案,但找不到任何帮助,尽管错误并不少见。
我的数据:
r - 这是对数据框进行排序以在 ANOVA (aov) 中获得合理结果的正确方法吗?
我(理论上)了解如何解释方差分析的结果。我也知道这里提供的格式在执行 LMER 测试时是可以的,但由于样本量很小,我仅限于 Anova。
基本上,我想看看C2.dn
当“辅音”列的值为“单例”或“双联”时,变量的持续时间值是否显示任何持续时间差异?同样,如果V1.dn
和V2.dn
显示任何持续时间差异?通过比较音素的方式,我已经确认这些确实如此。环境。
例如,这里的单词 chape, chappe (Row 1,2, Col 'Filename') 是最小的对,其中V1_xsampa
表示元音 [a/@],C2_xsampa
表示辅音 [p] 或 [p:],并V2_xsampa
表示词尾 [e :]。所有这些音素在它们各自的列 ( V1.dn
, C2.dn
, V2.dn
) 中都有它们的数字(持续时间)值。
我希望我能清楚地理解。我是 R 的新手。任何帮助都会很棒。
这是我的部分数据:
编辑:
头(df)
文件名 说话者 辅音 位置 方式 发声 前元音 性别 V1.dn V1_xsampa C2.dn C2_xsampa 1 AK_chape.TextGrid 1 Singleton Bilabial Stop Voiceless Short F 8.190506 @ 8.004261 p 2 AK_chappe.TextGrid 1 Geminate Bilabial Stop Voiceless Short F 7.469901 @ 16.455435 p: TextGrid 1 Singleton Retroflex Stop 清音短 F 5.798567 @ 8.422198 t 4 AK_fatti.TextGrid 1 Geminate Retroflex Stop Voiceless Short F 5.883851 @ 15.216855 t
: 5 AK_katha.TextGrid 1 Singleton Dental/alveolar Stop Voiceless Short F 7.447716 @ 8.711895 t_d_h 6 AK_kute.TextGrid 1 Singleton Dental/alveolar Stop Voiceless Short F 7.360776 U 7.360776 t_d V2.dn V2_xsampa V1_dn C2_dn V2_dn 1 12.43744 e: 0.08190506 0.08004261 0.1243744 2 11.58376 e: 0.07469901 0.16455435 0.1158376 3 12.34388 i: 0.05798567 0.08422198 0.1234388 4 10.27983 i: 0.05883851 0.15216855 0.1027983 5 11.38643 A: 0.07447716 0.08711895 0.1138643 6 13.46687 e: 0.07360776 0.07360776 0.1346687
EDIT2: 输入(头(df))
文件名 说话者 辅音 位置 方式 发声 前元音 性别 V1.dn V1_xsampa C2.dn C2_xsampa 1 AK_chape.TextGrid 1 Singleton Bilabial Stop Voiceless Short F 8.190506 @ 8.004261 p 2 AK_chappe.TextGrid 1 Geminate Bilabial Stop Voiceless Short F 7.469901 @ 16.455435 p: TextGrid 1 Singleton Retroflex Stop 清音短 F 5.798567 @ 8.422198 t 4 AK_fatti.TextGrid 1 Geminate Retroflex Stop Voiceless Short F 5.883851 @ 15.216855 t
: 5 AK_katha.TextGrid 1 Singleton Dental/alveolar Stop Voiceless Short F 7.447716 @ 8.711895 t_d_h 6 AK_kute.TextGrid 1 Singleton Dental/alveolar Stop Voiceless Short F 7.360776 U 7.360776 t_d V2.dn V2_xsampa V1_dn C2_dn V2_dn 1 12.43744 e: 0.08190506 0.08004261 0.1243744 2 11.58376 e: 0.07469901 0.16455435 0.1158376 3 12.34388 i: 0.05798567 0.08422198 0.1234388 4 10.27983 i: 0.05883851 0.15216855 0.1027983 5 11.38643 A: 0.07447716 0.08711895 0.1138643 6 13.46687 e: 0.07360776 0.07360776 0.1346687
java - 为什么Java的Double Metaphone只给出四个字母代码?
我想使用 DoubleMetaphone 来获取给定字符串的语音编码。例如:
结果:计算机 -> KMPT
当我尝试对更长的字符串进行编码时,就会出现问题。
结果:dustinhoffmanisanactor -> TSTN
显然,它正在使用前 4 个编码字符并停止。在这种情况下,达斯汀 -> TSTN。
我使用了 Double Metaphone 的 Python 实现,它按预期工作。
r - 删除数据框中的非配对条目?
我的数据框“df”中的“辅音”列有两个数字级别,“Geminate”为 250,“Singleton”为 214。因为 Geminates 的数量更多,我怎样才能删除 Geminates 的额外条目,从而等同于“Singleton”?输出应该是只有那些“Geminate”的条目应该保留在“Singleton”中有对应的条目。“文件名”列中的前两个字符表示说话者,然后是测试的标记词。
我的数据框有 13 列和 464 行,因此,张贴图片(知道不鼓励这样做)。在此先感谢您的帮助。问候。
编辑: dput() 的输出在提供的链接中(因为我无法在此处粘贴它,超过了字符限制)。 dput() 输出
python - 语音字符到语音
我想在我的应用程序中为低级语言添加“文本到语音”的功能(例如:普什图语,...)
.NET 中有一个库
python中是否存在用于执行此活动的引擎?我想知道python是否存在“语音字符到语音”引擎?