我对 python 很陌生,以前也没有处理过文本……我有 100 个文本文件,每个文件都有大约 100 到 150 行描述患者状况的非结构化文本。我使用以下命令在 python 中读取了一个文件:
with open("C:\\...\\...\\...\\record-13.txt") as f:
content = f.readlines()
print (content)
现在我可以将此文件的每一行拆分为其单词,例如:
a = content[0].split()
print (a)
但我不知道如何将整个文件拆分为单词?循环(while 或 for)对此有帮助吗?
谢谢你们的帮助。你的回答帮助我写这个(在我的文件中,单词被空格分隔,所以我认为这是分隔符!):
with open ("C:\\...\\...\\...\\record-13.txt") as f:
lines = f.readlines()
for line in lines:
words = line.split()
for word in words:
print (word)
这只是逐行拆分单词(一行中的一个单词)。