我有这样的文件
apple
ae-pal
noun.
a fruit
ball
b'al
noun.
playing material
round shaped
等等。所以它以单词开头,然后是一个空行和发音(我知道上面的那些是愚蠢的:P)。然后是词性和意义。每学期后有空行。我最终想要的是进行递归调用,以便它拍摄第一个单词并放置在数据库中的一个表中(mysql,可能是),然后第二个进入同一个表的对应行,依此类推。
首先我想给这个空间编号。比如 1 2 3 4 等等。这样我就可以将所有 1、5、9(即 2*x+1)放在一个地方,将 2*x 放在另一个地方,这样我就可以达到我的目的,我可以将它们推送到数据库中,最终得到我的字典。
我可以找到一种用数字替换空行的方法,但不知道如何使它们增加数字。我想知道如何使用 sed、awk 甚至 python 来实现这一点。毫无疑问,正则表达式将在那里。
伪代码
is line empty ?
yes ? give a number x (x =1)
increase x by 1
no ? go to next line
repeat till eof.
我希望我足够清楚!