因为我讨厌来回点击阅读维基百科文章,所以我正在尝试构建一个工具来根据以下算法创建“扩展的维基百科文章”:
- 创建两个变量:
Depth
和Length
。 - 将维基百科文章设置为种子页面
- 解析这篇文章:只要有指向另一篇文章的链接,就获取第一个
Length
句子并将其包含在原始文章中(例如,在括号中或以其他方式突出显示)。 - 以递归方式执行此操作直到某个
Depth
,即不超过两个级别。
结果将是一篇可以一口气阅读的文章,而无需总是来回点击......
你将如何在 Python 中构建这样的机制?应该使用哪些库(是否有用于此类任务的库)?有什么有用的教程吗?