我需要抓取一些网页并从中提取内容。我打算选择一些特定的关键字并映射与它们有某种关系的数据。但我不知道,我怎么能做到这一点。有人可以建议我一些算法吗?
例如,我需要下载一些关于苹果的网页,并将苹果的相关数据映射到它并存储在数据库中,这样如果有人需要它的具体信息,我可以快速准确地提供它。
指出有用的库也会很有帮助。我打算用python来做。
我需要抓取一些网页并从中提取内容。我打算选择一些特定的关键字并映射与它们有某种关系的数据。但我不知道,我怎么能做到这一点。有人可以建议我一些算法吗?
例如,我需要下载一些关于苹果的网页,并将苹果的相关数据映射到它并存储在数据库中,这样如果有人需要它的具体信息,我可以快速准确地提供它。
指出有用的库也会很有帮助。我打算用python来做。