问题标签 [supervised-learning]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
851 浏览

performance - 我可以在多类中计算 TP、TN、FPR 和 FNR

如果我将数据分类为 5 类,我会在 5 类分类中得到混淆矩阵,但我无法计算它

我可以在多类问题中计算 TP、TN、FPR 和 FNR 吗?

谢谢!

0 投票
1 回答
257 浏览

nlp - Word sense disambiguation using WEKA

I've got a training DataSet and a Test DataSet. How can we experiment and get results ? Can WEKA be used for the same ?

The topic is Word Sense Disambiguation using Support Vector Machine Supervised learning Approach

The Document types within both the sets include following file types: 1. 2 XML files 2. README file 3. SENSEMAP format 4. TRAIN format 5. KEY format 6. WORDS format

0 投票
5 回答
416 浏览

machine-learning - 机器学习文本分类技术

我是机器学习的新手。我正在做一个需要应用机器学习概念的项目。

问题陈述:

我有大量(比如3000)关键词。这些需要分为七个固定类别。每个类别都有训练数据(样本关键词)。我需要一个算法,当一个新的关键词传递给它时,它应该预测这个关键词属于哪个类别。

我不知道需要为此应用哪种文本分类技术。我们有任何可以使用的工具吗?

请帮忙。

提前致谢。

0 投票
1 回答
36 浏览

algorithm - 预测组织的开业和关闭

给定组织抄表的训练数据,每天每隔 15 分钟记录一次。像一些 N 天,我们将获得数据。

现在,借助这些数据,我们需要知道某个组织在特定的一天是关闭的还是开放的。如果有人在这个领域工作,我需要知道是否有任何链接可以帮助解决这个问题。

关闭我的意思是那天的电力消耗显然几乎是恒定的,尽管这只是一个需要考虑的特征。

那么如何以最好的方式预测呢?

0 投票
1 回答
46 浏览

machine-learning - 哪个是正确的学习算法,k-means?

我正在研究一种基本的决策算法,即基于并行循环迭代的时间,决定增加或减少分配给进程的线程数量。我最初的方法是取十次迭代的平均时间,并将其与之前的(平均)时间进行比较,每 5 秒一次。这种方法失败了......它本身总是会将线程计数降低到 1。

所以我转向无监督学习,使用聚类作为决定时间 x是否应该分类为:增加、坚持或减少要分配的线程数量。

基于我正在分类的数据类型,我相信 K-means 是无监督学习的一个很好的起点?我在正确的轨道上......

0 投票
2 回答
1108 浏览

machine-learning - 监督学习是分类的同义词,无监督学习是聚类的同义词吗?

我是机器学习的初学者,最近阅读了有关监督和非监督机器学习的内容。看起来监督学习是分类的同义词,无监督学习是聚类的同义词,是这样吗?

0 投票
2 回答
1482 浏览

r - Rtexttools 使用 create_matrix 创建文档术语矩阵时遇到问题

我第一次使用 RTextTools。这是我的 create_matrix 代码

我收到以下错误:

我还没有看到其他人发布此错误,并且认为我缺少一些非常基本的东西。

彼得

0 投票
1 回答
178 浏览

python - python中的文本转换

我正在用 PyBrain 构建一个用于文本分类问题的循环神经网络。经过多次尝试,我仍然无法弄清楚如何将字符串列表转换为可用作数据集的数组。我做了什么:

所以我得到了训练数据的频率表,但我无法弄清楚如何将数据本身转换为可以用作 main_ds 变量中的输入的某种格式。

0 投票
1 回答
319 浏览

java - 如何开始得出预测的数学分数的过程?

这涉及来自https://stackoverflow.com/help/on-topic的“软件算法”

我正在解决黑客级别的问题(非竞争)https://www.hackerrank.com/challenges/predict-missing-grade

基本上,您将获得一群学生在其他科目(不包括数学)中的分数的测试数据,您将根据他们所有其他测试分数来预测他们的数学分数。假设您收到了以下数据

{"SerialNumber":1,"English":1,"Physics":2,"Chemistry":3,"ComputerScience":2}

您将如何生成该学生的数学分数或提出预测引擎来生成数学分数?我知道这就是这个问题的全部意义,但有人可以给我一个提示或资源,以便我有机会弄清楚这一点并真正开始吗?我真的很想学习。

0 投票
1 回答
367 浏览

machine-learning - 使用 ELKI MiniGUI 进行带有训练集和测试集的异常检测

我有:

  1. training.arff仅包含具有正常行为的样本的文件。

  2. test.arff包含具有正常和异常行为的样本的文件。

我想使用 ELKI MiniGUI 使用半监督学习进行异常检测。

我相信通常我应该使用构建/训练模型training.arff,然后将模型应用到test.arff.

我使用哪种算法并不重要。

我似乎无法找到将这两个文件放在 ELKI MiniGUI 中的位置,所以我会得到我想要的结果。(只有一个dbc.in

*PS:尝试使用 weka 一周后我放弃了,但我不仅限于 ELKI。

谢谢!!