我正在尝试在 gutenberg.org 上解析电子书中的文本,以提取有关书籍的信息,例如标题。
那里的每一本书都有这样的一行:
*** START OF THIS PROJECT GUTENBERG EBOOK THE ADVENTURES OF SHERLOCK HOLMES ***
我想使用这样的东西:
book_name=()
index = 0
for line in finalLines:
index+=1
if "*** START OF THIS PROJECT GUTENBERG EBOOK "%%%"***" in line:
print(index, line)
book_name=%%%
但我显然做得不对。有人可以告诉我它是如何完成的吗?