所以我一直在四处寻找,试图弄清楚如何提取一些特定的数据,例如文本,并将这些数据推送到组织数据的程序中。
因此,如果您以 homedepot.com 为例,想从“2x4 wood”下列出的每个项目中提取,您需要从每个项目中获取名称、描述和规格,并将该数据导入到一个软件中包含这些数据?
所以我想这会类似于自动数据输入?
根据我的研究,我需要编写一个爬虫程序,该程序旨在搜索特定术语,然后爬取结果返回的每个页面并获取我需要的数据。
但是我有一点问题:我真的不知道任何编程/脚本,并且不确定从哪里开始。我发现了一个基于 Python 的名为 Scrapy 的东西。这是我想用于爬虫的东西吗?
我遇到的下一个问题是,我不知道现在如何将收集到的数据导入到软件中?关于我应该在哪里找到这个答案的任何提示?
我想用这个想法来帮助我学习如何编写脚本。