问题标签 [supervised-learning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
performance - 我可以在多类中计算 TP、TN、FPR 和 FNR
如果我将数据分类为 5 类,我会在 5 类分类中得到混淆矩阵,但我无法计算它
我可以在多类问题中计算 TP、TN、FPR 和 FNR 吗?
谢谢!
nlp - Word sense disambiguation using WEKA
I've got a training DataSet and a Test DataSet. How can we experiment and get results ? Can WEKA be used for the same ?
The topic is Word Sense Disambiguation using Support Vector Machine Supervised learning Approach
The Document types within both the sets include following file types: 1. 2 XML files 2. README file 3. SENSEMAP format 4. TRAIN format 5. KEY format 6. WORDS format
machine-learning - 机器学习文本分类技术
我是机器学习的新手。我正在做一个需要应用机器学习概念的项目。
问题陈述:
我有大量(比如3000)关键词。这些需要分为七个固定类别。每个类别都有训练数据(样本关键词)。我需要一个算法,当一个新的关键词传递给它时,它应该预测这个关键词属于哪个类别。
我不知道需要为此应用哪种文本分类技术。我们有任何可以使用的工具吗?
请帮忙。
提前致谢。
algorithm - 预测组织的开业和关闭
给定组织抄表的训练数据,每天每隔 15 分钟记录一次。像一些 N 天,我们将获得数据。
现在,借助这些数据,我们需要知道某个组织在特定的一天是关闭的还是开放的。如果有人在这个领域工作,我需要知道是否有任何链接可以帮助解决这个问题。
关闭我的意思是那天的电力消耗显然几乎是恒定的,尽管这只是一个需要考虑的特征。
那么如何以最好的方式预测呢?
machine-learning - 哪个是正确的学习算法,k-means?
我正在研究一种基本的决策算法,即基于并行循环迭代的时间,决定增加或减少分配给进程的线程数量。我最初的方法是取十次迭代的平均时间,并将其与之前的(平均)时间进行比较,每 5 秒一次。这种方法失败了......它本身总是会将线程计数降低到 1。
所以我转向无监督学习,使用聚类作为决定时间 x是否应该分类为:增加、坚持或减少要分配的线程数量。
基于我正在分类的数据类型,我相信 K-means 是无监督学习的一个很好的起点?我在正确的轨道上......
machine-learning - 监督学习是分类的同义词,无监督学习是聚类的同义词吗?
我是机器学习的初学者,最近阅读了有关监督和非监督机器学习的内容。看起来监督学习是分类的同义词,无监督学习是聚类的同义词,是这样吗?
r - Rtexttools 使用 create_matrix 创建文档术语矩阵时遇到问题
我第一次使用 RTextTools。这是我的 create_matrix 代码
我收到以下错误:
我还没有看到其他人发布此错误,并且认为我缺少一些非常基本的东西。
彼得
python - python中的文本转换
我正在用 PyBrain 构建一个用于文本分类问题的循环神经网络。经过多次尝试,我仍然无法弄清楚如何将字符串列表转换为可用作数据集的数组。我做了什么:
所以我得到了训练数据的频率表,但我无法弄清楚如何将数据本身转换为可以用作 main_ds 变量中的输入的某种格式。
java - 如何开始得出预测的数学分数的过程?
这涉及来自https://stackoverflow.com/help/on-topic的“软件算法”
我正在解决黑客级别的问题(非竞争)https://www.hackerrank.com/challenges/predict-missing-grade
基本上,您将获得一群学生在其他科目(不包括数学)中的分数的测试数据,您将根据他们所有其他测试分数来预测他们的数学分数。假设您收到了以下数据
{"SerialNumber":1,"English":1,"Physics":2,"Chemistry":3,"ComputerScience":2}
您将如何生成该学生的数学分数或提出预测引擎来生成数学分数?我知道这就是这个问题的全部意义,但有人可以给我一个提示或资源,以便我有机会弄清楚这一点并真正开始吗?我真的很想学习。
machine-learning - 使用 ELKI MiniGUI 进行带有训练集和测试集的异常检测
我有:
training.arff
仅包含具有正常行为的样本的文件。test.arff
包含具有正常和异常行为的样本的文件。
我想使用 ELKI MiniGUI 使用半监督学习进行异常检测。
我相信通常我应该使用构建/训练模型training.arff
,然后将模型应用到test.arff
.
我使用哪种算法并不重要。
我似乎无法找到将这两个文件放在 ELKI MiniGUI 中的位置,所以我会得到我想要的结果。(只有一个dbc.in
)
*PS:尝试使用 weka 一周后我放弃了,但我不仅限于 ELKI。
谢谢!!