问题标签 [mining]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - C++ BOOST 库和捆绑属性
我正在尝试使用 Boost 制作一个图挖掘程序,所以我从图结构开始,这是我制作的代码:
这一行有一个问题:
我怎样才能创造这个边缘?PS:请告诉代码是否正确(我是指vue的概念点)
bitcoin - 为什么比特币无法进行挖矿?
我也运行了守护程序,但它不工作错误是:
java - JUNG:我们如何根据顶点的一些属性进行图聚类?
我有 500 多个顶点和 700 多个边的图形数据库。我图中的顶点表示“论文”类的对象,它具有 ID、标题、年份、出版商、出版商 ID、作者、作者 ID 等成员。我想根据顶点的某些属性对子图进行聚类,如所有顶点具有相同作者或出版商的将在一个集群中。因此,每个属性都会有单独的集群(每种类型的集群可能有不同的颜色)。那么有什么算法可以实现这一点吗?
r - R中的文本搜索
我正在尝试进行查询以在名为 RISmed 的 R 包中使用,该包将从 pubmed 数据库中搜索并下载相关的期刊文章信息。我想总是一起搜索两个单词,例如:
如果我使用上面的命令,它将分别搜索基因和测序,然后同时搜索基因和测序,这意味着如果在整个文本中存在基因和测序,我的命令会捕获它们,但我想以这样的方式搜索,它会考虑“基因测序”,两个词永远在一起。我该如何编写该查询?有人能帮帮我吗?
提前致谢 !
bitcoin - 比特币矿工如何检查双花或超花?
我可以可视化该过程的唯一方法是:在区块链中搜索与正在处理的交易具有相同源地址的所有交易,将它们全部加起来(包括正在处理的 trx)以验证它们加起来小于或等于到源交易金额。
对每笔比特币交易都这样做听起来非常低效。
他们是怎么做到的?
r - 在 R 中拆分单词
我有一个文本文件,其中包含不应该连接的单词。以下是文本文件的示例:
Gangnam S. 在 Yelp 上对 JOEY Eaton 中心 - 多伦多 (4/5) 的评论。JOEY Eaton Centre 86 条点评 评分详情 体育酒吧 1 Dundas St W Toronto;ON M5G 1Z3 社区:市中心 (647) 352-5639 http://www.joeyrestaurants.comAddPhotos 营业时间:周一至周日上午 11 点至凌晨 2 点适合儿童:否 接受信用卡:是 停车:车库;街头服饰:休闲 适合团体:是 价格范围:$ 需要预订:是 送货:否 外卖:是服务员服务:是 户外座位:是 Wi-Fi:免费 适合:晚餐 酒精:全酒吧 噪音水平:平均 环境:时尚有电视:是 迎合:否 首先评论 Karen G. 编辑业务信息 发送给朋友书签 写评论 JOEY Eaton Center 的 86 条评论 评论匹配:搜索评论 ReviewHighlights ...我必须得到杀手 Ahi 金枪鱼炸玉米饼 - 用很少见... 在 3 条评论中尝试龙虾馄饨或龙虾烤奶酪。在 8 条评论中...点了孟买黄油鸡 - 配上烤面包... 在 7 条评论中加载中... 排序方式: Yelp 排序 | 日期 | 评级 | 精英| Facebook Friends' Facebook Friends FromReviewers You' 重新关注您朋友的评论 86 条英文评论 Catherine J. Elite'12 的评论 11 位朋友 26 条评论 Catherine J. Markham; ON 11/21/2012 一个仓库大小的酒吧和一个匹配的阵容;但是跳过乔伊的欢迎垫,你会得到一个很好的城市介绍。有几个原因可以享受这个联合:1)大小。它很大。
使用 R 清理此文本和不正确连接的单词的有效方法是什么?
谢谢,
布奇
r - 如何获取已经存在于另一个文件中的文档中的单词数?
我正在研究文本挖掘领域,并且是新手。我是一个文件,其中包含一个单词列表,其相应的权重如下所示:
现在我想用一个文档检查列表中的每个单词,并检索文档中每个术语的出现次数。任何人都可以告诉如何在 R 中做同样的事情吗?
我使用了 tm 包,但我不想做术语文档矩阵。首先我需要找到与上面匹配的单词,然后我需要找到这些单词在每个文档中出现的次数
r - 在 R 中同时挖掘多个主题标签
我对 R 有点陌生,所以这个问题可能看起来很基本。我想根据 R 中的多个主题标签生成列表。我设计了一个应用程序,当我把它放在搜索框中时,它会为#AT&T 或#Verizon 挖掘推文。任何关于我如何挖掘推文的建议其中包含这两个主题标签(类似于这条推文“xyxyxyxxyxyxy #AT&T xyxyxyx #Verizon xyxy”)。
machine-learning - 如何使用槌提取主题关键短语
我已经在 mallet 中导入了文件,现在我想从导入的数据中建模主题并将它们存储在一个文本文件中,我可以从中读取这些主题。任何人都可以帮助编写主题提取的命令,因为我在下面输入了主题提取的命令,但它抛出了异常。
bin\mallet import-dir --input D:\Data\test1 --output test1.mallet --keep-sequence --remove-stopwords --extra-stopwords extra.txt
通过删除 --keep-sequence --remove-stopwords --extra-stopwords extra.txt 我可以在之后导入文件,当我尝试训练模型时抛出异常。
nlp - 情绪计算公式是什么
使用情绪评级词典计算情绪的实际公式是什么。我使用的词典包含 -5 到 5 之间的评分。我想计算单个句子的情绪。要么我必须计算句子中所有情感排名词的平均值,要么只对它们进行总结。