我是一个超级蟒蛇菜鸟。
我正在尝试确定名称列表的变音位代码。稍后将比较这些代码以找到潜在的相似名称。
jellyfish 模块很适合我的需求,我可以在创建列表的时候获取变音位码,如下:
import jellyfish
names = ['alexander','algoma','angel','antler']
for i in names:
print(i, "metaphone value =", jellyfish.metaphone(i))
##OUTPUT:
alexander metaphone value = ALKSNTR
algoma metaphone value = ALKM
angel metaphone value = ANJL
antler metaphone value = ANTLR
但是,我需要获取约 3000 个名称列表的变音位代码。我用我需要的列标题和现有的名称列表创建了一个 .csv。它看起来像这样:
RID *,ST_NAME,FirstWord,FirstWordMeta,StMeta
742,A F JOHNSON,A,,
1240,ABBEY,ABBEY,,
2133,ACES,ACES,,
362,ADAMS,ADAMS,,
因此,理想情况下,我需要 FirstWordMeta = 每行 FirstWord 列中单词的变音位代码,StMeta = 每行 ST_NAME 列中单词的变音位代码。我希望输出 .csv 看起来像这样:
RID *,ST_NAME,FirstWord,FirstWordMeta,StMeta
742,A F JOHNSON,A,A,A F JNSN
1240,ABBEY,ABBEY,SS,AB
2133,ACES,ACES,SS,SS
362,ADAMS,ADAMS,ATMS,ATMS
我已经尝试过 csv 模块,但我不明白在使用 jellyfish.metaphone() 时如何合并引用特定列