问题标签 [mining]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1791 浏览

mysql - MySQL 中的列存储索引技术与基于向量的批处理

我使用 MySQL 作为数据库,由于数据库很大,它已按列索引。但是现在需要使用类似 MSSQL 的方法进行索引,因为据说它执行得更快,其链接如下:

http://blogs.technet.com/b/dataplatforminsider/archive/2011/08/04/columnstore-indexes-a-new-feature-in-sql-server-known-as-project-apollo.aspx

据它介绍,它使用列存储索引以及基于向量的批处理。所以我想知道,MySQL中有没有类似的技术可以快速处理从数据库中获取数据??????

提前致谢。

0 投票
1 回答
1148 浏览

json - R 网络/文本挖掘 - 网络查询 JSON 读取

在 Blekko 搜索引擎中,您可以获得 JSON 格式的搜索结果,例如使用搜索词“lifehacker”:

http://blekko.com/ws/?q=lifehacker+%2Fjson

您如何从 R 执行此查询并解析内容?[有一个 URL、一个 RSS URL 和一个带有正文的片段。]

我已经尝试过软件包 tm.plugin.webmining 和boilerpipeR,但无法弄清楚。

0 投票
1 回答
367 浏览

r - txt 文件在 R 包 tm 中生成 NA(文本挖掘)

我想阅读一个 txt 文件并做一些文本挖掘方法。当我在 R 中使用 tm 包时,我收到了很多错误消息。例如,如果我想关联最常见的词,我只会得到 NA。这是我到目前为止使用的代码:

之后,我收到以下错误消息:

好的调查,我使用了以下代码,这是 findAssocs() 的逐步方法:

但是,我得到以下输出:

从我的角度来看,文本有问题,但我对这种奇怪的行为没有任何解释。我的问题是,如果有人有解决这个问题的办法。我的 R (2.15.2) 在 Mac 系统 (x86_64-apple-darwin9.8.0/x86_64 (64-bit)) 上运行。

非常感谢!

0 投票
1 回答
270 浏览

audio - Audio Mining and speech processing

We are intending to do a project on audio mining.It basically takes input from the user and processes the data input and gives desired results(but only on numbers).We are trying to design an android application for the same.If user inputs say "12345" then it should look for the data stored in db and do some processing and provide us details.Can anyone give insight into what can be done or where to start from.

0 投票
0 回答
1760 浏览

bitcoin - 地层挖掘如何设置

以下是层协议配置文件的一些行:

谁能解释我应该在每个参数中输入什么值?我真的很困惑……

0 投票
1 回答
126 浏览

text - 文本挖掘一团乱麻的数据

我有一个非常有趣的问题陈述......我有两个实际上彼此相关的数据集(它们都与汽车品牌和型号有关)。其中一列是处理过的数据(品牌、型号和变体已被拆分、处理和编辑),而另一列是原始提要。

有没有什么办法可以让两人结缘?我完全迷路了,因此没有提供任何代码。问题是没有办法链接这两列,因为没有 SID....它的纯名称。

0 投票
2 回答
2288 浏览

python - 搜索 twitter 并从“挖掘社交网络”示例中收集搜索结果

我正在阅读此处“挖掘社交网络 2nd E”的代码,并试图了解示例 6 的工作原理!我正在尝试打印的长度statuses并正在输出不同的结果,下面我将显示两个代码片段和每个代码片段的结果,我希望有人能向我解释为什么我会得到不同的结果......提前谢谢.

输出是:

这正是我所期待的。但是如果我将它添加到上面的代码中:

输出将是:

我的问题是为什么在第二次它只打印三个批次而不是五个,因为 for 循环设置为循环五次?以及为什么它们每个都不是 100 计数?

0 投票
1 回答
61 浏览

java - 关于如何在互联网上挖掘信息并从图像中提取文本的建议

我对如何在互联网上挖掘信息以及如何从图像中提取文本感兴趣。

所以我正在寻找有关如何执行此操作的信息,我想自己编程。有没有什么论文可以很好地解释采矿和提取?

有人可以帮我吗?

亲切的问候,

0 投票
1 回答
5265 浏览

proxy - stratum+tcp://us3.wemineltc.com:3333 -O 判断.1:x -B

我对linux(Centos)真的很陌生。我正在监视我们的一台服务器,我发现了这些进程并使服务器负载非常重。这是攻击吗??我试图用谷歌搜索它,由于我的菜鸟,我不太明白。它出现在几周前。我读过它是一个挖矿协议。请赐教。我只是杀死 pid 来阻止这些。请帮忙。

我附上了htop的截图。

谢谢!

在此处输入图像描述

0 投票
1 回答
295 浏览

bitcoin - CGMiner 错误:SEM:Icarus USB 超时等待

我在 MACOS X 10.8.5 上设置了 CGMiner 3.8.1(甚至是此版本之前的版本)我有 11 个 Block Erupters,但 CGMiner 只看到 10 个并不断给出此错误:SEM:Icarus USB 超时等待(等等)。我已经更换了 USB 集线器,将 USB 直接插入计算机,但似乎没有任何解决办法。BFGMiner 看到并认出了所有这些,我真的不喜欢它。

你们知道我能做些什么来修复CGMiner吗?

谢谢你。