我有一个文本文件,每一行的形式是:
TAB WORD TAB PoS TAB FREQ#
Word PoS Freq
the Det 61847
of Prep 29391
and Conj 26817
a Det 21626
in Prep 18214
to Inf 16284
it Pron 10875
is Verb 9982
to Prep 9343
was Verb 9236
I Pron 8875
for Prep 8412
that Conj 7308
you Pron 6954
你们中的一个正则表达式向导会帮助我从文件中分离出单词吗?希望我会在 TextPad 中进行查找和替换,就是这样。多次查找和替换很好。一件事:注意搜索“动词”也会出现“动词”这个词,而不仅仅是词性,所以要小心。最后,我想以每行 1 个单词结束。
非常感谢!