问题标签 [site-mining]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
188 浏览

site-mining - 现场挖掘工具

这里提出的许多问题都与我正在进行的研究有关。这些问题和答案分布广泛,并不总是很容易找到,进行手动浏览,有时也会在不相关的主题中出现有见地的答案或评论。

我想根据关键字集自动查找这些相关的问答,然后将这些信息用作进一步深入研究的指针。

我可以使用哪些工具(最好是开源工具)来进行这种类型的站点挖掘?我不是网络专家,对我来说,尝试开发它们需要很长时间,而且还会影响我本可以花在研发上的时间。

0 投票
2 回答
196 浏览

data-mining - 车辆搜索的最佳数据挖掘方法是什么?

我正在尝试构建一个搜索引擎,该引擎可以浏览在线车辆分类,例如 Oodle、eBay 汽车和 craigslist。我还有一个包含标准车辆名称和规格的大型数据库。我想做的是对于我通过分类网站找到的每条记录,能够准确地确定它是什么车型、款式(来自我的数据库)。例如,我的数据库中福特卡车的标准名称是:2003 Ford F150。

然而,在分类网站上,人们可能将其称为:“2003 Ford F 150”或“2003 Ford f-150”或“03 Ford truck 150”。是否有有效的数据挖掘/文本分类算法能够将这些文本标准化为上述标准名称?

0 投票
2 回答
84 浏览

data-mining - 如何衡量两个网页之间的语义关系

假设,我正在访问一个大学网页。那里有很多老师的简介。尽管这些页面在语法上不相关,但在语义上是相关的。我如何衡量这种类型的关系?实际上我应该关注哪个参数来找到关系?