很简单,我只是在寻找一种从给定网站或网站部分中提取词频的简单方法。
我也有兴趣计算整个网站中两个给定单词之间的平均距离。距离单位是单词。
我问这个问题是因为坦率地说,我无法找到很多信息来引导执行这样的任务的直觉。我没有任何网络蜘蛛或任何形式的抓取经验。
谢谢(我之前问过这个问题,但它的格式不正确)
很简单,我只是在寻找一种从给定网站或网站部分中提取词频的简单方法。
我也有兴趣计算整个网站中两个给定单词之间的平均距离。距离单位是单词。
我问这个问题是因为坦率地说,我无法找到很多信息来引导执行这样的任务的直觉。我没有任何网络蜘蛛或任何形式的抓取经验。
谢谢(我之前问过这个问题,但它的格式不正确)