问题标签 [training-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2208 浏览

android - 如何将 tesseract 中的语言偏好从英语更改为其他语言?

通过遵循http://gaut.am/making-an-ocr-android-app-using-tesseract/,我能够用英语(使用 tesseract)成功地为 android 构建一个简单的 ocr 应用程序

现在它可以识别英文字符了。但是我怎样才能将语言偏好从英语更改为任何其他语言?前印度语

我已经下载了印度语言的训练数据并用英语替换并相应地修改了一些代码。但它并没有出现结果。

0 投票
1 回答
659 浏览

visual-c++ - 带有 Visual C++ 的 OpenCV 2.4.3 表达级联分类器图像查询

我正在学习实现一个手势识别项目。为此,我浏览了几个教程,其中使用了颜色信息、背景减法和各种对象分割技术。

但是,我想使用一种使用级联分类器的方法,但是我对这种方法没有太多了解。我已经阅读了几篇文章和论文,并且理解了它的理论,但是,我仍然不明白什么是训练级联分类器的好图像。在自然彩色图像或通过精明边缘检测或其他方式处理的手势图像上训练它更好吗?

此外,是否有任何方法使用类似于 openTLD 的在线培训和测试方法,但在其中解释了步骤。2.3-2.4.3 的 openCV 文档在机器学习和对象识别和跟踪方面是不完整的,除了以下代码:http: //docs.opencv.org/doc/tutorials/objdetect/cascade_classifier/cascade_classifier.html

我知道这是一个很长的问题,但我想彻底解释我的问题。这将帮助我更好地理解这个概念,而不仅仅是使用在线代码。

提前真诚感谢!

0 投票
1 回答
1064 浏览

matlab - 如何在 HMM matlab 统计工具箱中定义发射矩阵

我是 Matlab 图像处理的新手,现在我正在使用带有 Matlab 统计工具箱的 HMM 进行字符识别。

我有一个输入图像宽度:400,高度:100,图像是二进制图像。我将每个输入图像分成 10 个水平块。在每个块中,我计算图像的密度。因此在每张图像中我可以获得 10 个特征向量。

假设 F 是图像的特征向量

F=[26 55 74 123 186 260 258 75 43 21]

我的问题是如何将特征向量转换为 hmm 序列,以便我可以使用 hmmtrain 命令使用它。在我的情况下,发射矩阵是什么?

在问这个问题之前,我已经看过Omid Sakhi的类似例子。但是,我还是不明白。

0 投票
0 回答
143 浏览

training-data - 何时对数据进行中心化/规范化以增加泛化?

给定一个高维数据集并对数据应用 PCA 或其他一些降维技术,通常需要居中,有时需要标准化。当给定数据集以分解为训练/测试/验证集时,似乎只应在训练集上进行居中和归一化,并且应保存每个变量的这些值(均值/标准差)。然后,当计算验证/测试错误率时,验证/测试数据集应该集中并归一化,对应于为训练数据计算的值,而不是它们自己的这些参数的内在值。这通常正确吗?

0 投票
2 回答
4481 浏览

opencv - OpenCV Haartraining 不会永远结束

这是我第一次使用 opencv 的 haartraining。

只是为了练习,我使用了 35 个正图像和 45 个负图像。

但是当我尝试从数据中训练时,它不会永远完成,

即使参数被极度调整。

(最小命中率 = 0.001,最大误报率 = 0.999

由于这个极端值,我认为不会花费很多时间)

我的实验一定有什么问题?

这是我的命令和参数。

和结果。

0 投票
0 回答
1355 浏览

opencv - 在 OpenCV 中重新训练 HOG 导致没有命中

我目前正在尝试使用带有 HOG 描述符的 OpenCV 2.4.4 来计算汽车。因为汽车检测模型在 OpenCV 中不可用(与已经有检测器模型的人员检测器不同),我正在使用 SVMLight 和来自 INRIA 汽车数据集的汽车数据集创建我自己的模型正样本和负样本)。

然后我使用带有 SVMLight 的正负样本创建模型(将图像大小调整为 128 * 104,因为 HOG 图像必须是 2 的幂),遵循教程和代码。我将模型应用于我的程序,它可以正确检测汽车,但也有很多误报(每张图像 3-8 个误报)

我阅读了 HOG Detector 的 Dalal 论文,发现需要使用通过将初步模型应用于负样本而发现的误报来重新训练模型。生成的补丁大小不同,所以我再次将其调整为 128*104 像素。

我像初步运行一样使用正负样本重新运行 HOG 训练程序,但是这次在负样本上添加了误报(这是我根据 Dalal 的论文认为的重新训练)。然后我有重新训练的模型。

不幸的是,我使用新模型运行汽车检测程序,但是尽管我使用了正样本图像和其他包含汽车的图像,但所有图像都没有检测到汽车。

这很有趣,我很好奇你们是否能指出我做错了什么。任何讨论或问题也值得赞赏!

我尝试了同样的事情,现在使用行人图像。结果还是一样,初步模型导致很多误报。再训练后,结果是没有命中(0.0命中阈值)。如果我将命中阈值降低到 -0.1 到 -0.5,则检测到正面图像,但命中率很低(50-70%)。好吧,我想这最终是关于命中率和误报之间的权衡,但是,再训练可以让模型更准确

编辑 在这个论坛搜索后,我认为对于我的相机是静态的系统,如果我使用背景分割和斑点跟踪会更好。我目前不再探索 HOG,但是对于任何知道 HOG 训练和检测问题出在哪里的人,也许您想在这里发布答案以帮助其他有相同问题的人

0 投票
1 回答
3214 浏览

ms-access - C# - Emgu Cv - 人脸识别 - 将保存到 Access 数据库的人脸训练集作为二进制文件加载到 EigenObjectRecognizer 中以进行人脸识别

我很难将训练集从 Ms Access 数据库加载到进行人脸识别的主窗体中。我将带有名称和 ID 的训练集作为具有 OLE 对象格式的二进制数据保存到数据库中。我用来更改、保存和读取数据库中的数据并保存到训练集中的方法是

我用来将转换后的字节数据存储到数据库的方法如下:

我用来读取此二进制数据的方法如下:

我已经成功地将训练集/图像作为二进制数据保存到数据库中。问题是当我加载这些训练集进行识别时。

即使在数据库中保存了面孔,我也只会在表单加载时收到消息。我使用了 EigenObjectRecognizer,如有必要,我将发布代码。

0 投票
2 回答
2727 浏览

stanford-nlp - 斯坦福 NER:我如何创建一个可以使用和测试的新训练集?

根据我的理解,要创建一个训练文件,你把你的话放在一个文本文件中。然后在每个单词后面加上一个空格或制表符以及标签(例如 PERS、LOC 等...)

我还将示例属性文件中的文本复制到写字板中。如何将这些放入可以输入分类器并使用的 gz 文件中?

不过请指导我。我是一个新手,对技术相当无能。

0 投票
1 回答
865 浏览

java - 错误找不到符号和类离散属性

我已将文件名指定为 FileReader

  1. 我在无法归档符号上遇到错误
  2. 找不到符号符号:类离散属性,位置:类分类器.FileReader
  3. 找不到符号符号:变量离散属性位置:类分类器.FileReader
0 投票
0 回答
399 浏览

machine-learning - 使用 weka KnowledgeFlow 环境将训练集应用于实际数据

在youtube上浏览了许多教程后,找不到答案...

我有两个 arff 文件,一个带有实际测试结果,类是数字 0-48,另一个带有“?” 作为班级。

我使用了 10 折交叉验证 REPtree 并得到了一个相当低的错误。

我的问题是我不明白如何使用 weka 将此训练集应用于我拥有的“未预测”数据。训练集由回答在线调查的用户组成,另一个文件是未回答调查的用户。

这是我实际设置的屏幕截图。 在此处输入图像描述

非常感谢!!