python - Python将单个单词排序为字母+列中的相应翻译

Question

所以，这是作为初学者非常友好地提供给我的脚本：

#!/usr/bin/python
# -*- coding: utf-8 -*-
from __future__ import with_statement    # needed for Python 2.5
from itertools import chain

def chunk(s):
    """Split a string on whitespace or hyphens"""
    return chain(*(c.split("-") for c in s.split()))

def process(latin, gloss, trans):
    chunks = zip(chunk(latin), chunk(gloss))
    # now you have to DO SOMETHING with the chunks!

def main():
    with open("examples.txt") as inf:
        try:
            while True:
                latin = inf.next().strip()
                gloss = inf.next().strip()
                trans = inf.next().strip()
                process(latin, gloss, trans)
                inf.next()    # skip blank line
        except StopIteration:
            # reached end of file
            pass

if __name__=="__main__":
    main()

然而，

我刚刚和我的讲师谈过了，他告诉我他不希望我们使用

__ x __

功能，因为它“在课程的这一点上对于学生的需求来说太先进了”。我完全不知道我需要在“块”或“过程”字段中添加什么，到目前为止，我已经能够弄清楚大多数其他练习（有一些提示）但这个只是远远超过我。这个特殊的部分值 20 分中的 15 分，这让我感觉有点恶心！任何进一步的帮助将不胜感激。

原帖（对不起，太长了！）

我正在尝试执行以下操作：我有一个非英语语言的文本，使用连字符分解成语素（每个单词的一部分），带有英语光泽（每个语素的语言翻译）和下面的直接翻译。例如。

Itali-am fat-o profug-us Lavini-a-que ven-it

意大利-Fem:Sg:Acc 命运-Neut:Sg:Abl 逃亡-Masc:Sg:Nom Lavinian-Neut:Pl:Acc come:Perf-3-Sg:Indic:Act

“在飞行中[驱使]命运来到意大利和拉维尼亚[海岸]”

我将在一个文件中包含多个文本，例如上述文本 - 即

blank line

a line of latin broken up with hyphens

a line of gloss broken up with corresponding hyphens, using colons to join elements

a line of translation

blank line

latin

gloss

translation

ad infinitum.

我需要做的是编写一个文件，它给我以下输出：

Itali:    1    Italy
am:    1    Fem:Sg:Acc
fat:    1    fate
o:    1    Neut:Sg:Abl
profug:   1    fleeing
us:    1    Masc:Sg:Nom
Lavini:    1    Lavinian
a:    1    Neug:Pl:Acc
que:    1    come:Perf
ven:    1   3
it:     1   Sg:Indic:Act

其中第一列表示没有连字符的第一行文本；第二列表示出现的次数（在本例中每个只有 1 次），第三列是第一列的英文翻译，如文中所写。

如果有一个拉丁语素没有对应的英文注释/翻译，拉丁栏将照常显示，但英文栏将打印 [unknown]，如：

a:  1   [unknown]

如果相反，即没有对应拉丁语的英语语素，它应该打印

[unknown]:  1   kitten

最后，程序需要能够处理同音语素（即两个拼写相同但含义不同的拉丁语素）。例如

a:  16  Neuter:Plural
a:  28  Feminine:Singular

score 1 · Accepted Answer

每当您需要计算出现次数时，您都需要一个字典。

创建一个字典，其中键是 zip 生成的元组，值是一个列表，其中包含：[latin, amount, translation]。每次遇到相同的元组时，都会增加数量。

字典必须比函数寿命更长，因此您可能希望将其添加为参数。

完成后，您可以执行以下操作： result = dict.keys(); 结果.sort()。

我不确定我是否理解未知的部分。如果这不能解决该部分，您可能需要展示一个相关示例。

python - Python将单个单词排序为字母+列中的相应翻译

1 回答 1

Related

Reference