python - 在python中查找并将某些单词成行写入文件

Question

我有一个西里尔文的 .txt 文件。它的结构是这样的，但是是西里尔文：

city text text text.#1#N
river, text text.#3#Name (Name1, Name2, Name3)   
lake text text text.#5#N (Name1)        
mountain text text.#23#Na

我需要什么：
1）查看一行中的第一个单词2）如果它是“river”，那么在“ #3#
” 之后写下所有单词，即文件“river”中的名称（Name1，Name2，Name3）。

我还必须与行中的另一个第一个词有关，即city, lake, mountain。
我所做的仅查找第一个单词是否为“城市”并将整行保存到文件中：

lines = f.readlines()
for line in lines:
    if line.startswith('city'):
        f2.write(line)
f.close()
f2.close()

我知道我可以使用正则表达式来查找 Names: #[0-9]+#(\W+) 但我不知道如何将它实现到代码中。
我真的需要你的帮助！我很高兴得到任何帮助。

score 0 · Accepted Answer

如果你所有的河**都有 ,s 在他们之后，就像你发布的上面的代码一样，我会做类似的事情：

for line in f.readlines():
     items = line.split("**,")
     if items[0] == "**river":
          names = line.split("#")[1].strip().split("(")[1].split(")")[0].split(",")
          names = [Name1, Name2, Name3]
          #.. now write each one

score 0 · Accepted Answer

您在这里要做的是避免对所需文件的名称进行硬编码。相反，从输入文件中收集。创建您需要写入的文件的字典，根据需要打开每个文件。像这样的东西（未经测试，可能需要一些调整）：

 outfiles = {}
 try:
     with open("infile.txt") as infile:
         for line in infile:
             tag = line.split(" ", 1)[0].strip("*, ")     # e.g. "river"
             if tag not in outfiles:   # if it's the first time we've seen a tag
                 outfiles[tag] = open(tag = ".txt", "w")  # open tag.txt to write
             content = line.rsplit("#", 1)[-1].strip("* ")
             outfiles[tag].write(content + "\n")
 finally:
     for outfile in outfiles.itervalues():
         outfile.close()

python - 在python中查找并将某些单词成行写入文件

2 回答 2

Related

Reference