问题标签 [classification]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
9 回答
2428 浏览

php - 图像分类 - 检测平面图

我在一个房地产网站上工作,我想编写一个程序来确定(分类)图像是平面图还是公司徽标。

因为我用 php 编写,所以我更喜欢 php 解决方案,但任何 c++ 或 opencv 解决方案也可以。

平面图样本:

替代文字 http://www.rentingtime.com/uploads/listing/l0050/0000050930/68614.jpg

替代文字 http://www.rentingtime.com/uploads/listing/l0031/0000031701/44199.jpg

标志样本:

替代文字 http://www.rentingtime.com/uploads/listing/l0091/0000091285/95205.jpg

0 投票
2 回答
261 浏览

ruby - Ruby,为什么 FeedNormalizer 的使用会破坏 Classifier::CRM114

刚刚学习 Ruby,发现了一些奇怪的东西(至少对于 ansi-c 程序员来说)。

拥有 Mac OS X 10.6.2、ruby 1.8.7 (2008-08-11 patchlevel 72) [universal-darwin10.0]、feed-normalizer 1.5.1 和 crm114 1.0.3

运行上面的文件:

好吧,这只是演示。

现在取消注释该行#FeedNormalizer...

并在没有注释的情况下运行文件:

?!地球在这里发生了什么?为什么 FeedNormalizer 的使用会破坏 crm114(那些不相关)?如何调试这种情况?这是典型的另一个类打破其他类吗?是否也重新启动(嘿,这是 Mac ;))

0 投票
1 回答
3107 浏览

classification - Adaboost算法及其在人脸检测中的应用

我正在尝试了解 Adaboost 算法,但我遇到了一些麻烦。在阅读了 Adaboost 之后,我意识到它是一种分类算法(有点像神经网络)。但我不知道如何选择弱分类器(我认为它们是用于人脸检测的类似 haar 的特征)以及最终如何使用作为最终强分类器的 H 结果。我的意思是,如果我找到 alpha 值并计算 H,我将如何从中受益作为新图像的值(一或零)。请问有没有一个例子以完美的方式描述它?我找到了大多数 adaboost 教程中的加号和减号示例,但我不知道如何选择 hi 以及如何在人脸检测中采用相同的概念。我读了很多论文,我有很多想法,但直到现在我的想法都没有很好地安排。谢谢....

0 投票
4 回答
7350 浏览

classification - 音乐指纹如何工作(对于 Shazam 和 Lala.com 等网站)?

我的大型 (120gb) 音乐收藏包含许多重复的歌曲,我一直在尝试对曲目进行指纹识别以检测重复。由于我是 CS 专业的,所以我很好奇那里做了什么?我所做的任何事情都几乎没有像 Shazam 或 Lala.com 这样的准确性。他们如何“散列”曲目?我已经对我的所有文件(26,000 个文件)运行了标准 MD5 哈希,并且在不同的轨道上发现了数百个相等的哈希,所以这不起作用。

我对 Lala.com 更感兴趣,因为它们处理完整文件,不像 Shazam,但我假设两者都使用类似的技术。谁能解释如何为音乐生成唯一标识符?

0 投票
5 回答
6160 浏览

c++ - C++ 库/框架,机器学习中混合模型的 API

我想使用高斯混合模型进行数据聚类(使用期望最大化(EM)算法,该算法为每个观察值的每个分量密度分配后验概率)。是否有一个 c++ 库,它具有与示例数据集和示例一起实现的高斯混合模型?

0 投票
3 回答
124 浏览

algorithm - 聚合自动生成的特征向量

我有一个分类系统,不幸的是,出于工作原因,我需要对其进行模糊处理。假设我们有 5 个特性需要考虑,它基本上是一组规则:

我们取一个主题并获取它的 AE 值,然后尝试按顺序匹配规则。如果一个匹配,我们返回第一个结果。

C 是一个离散值,可以是 ae 中的任何一个。其余的只是整数。

规则集是从我们的旧系统自动生成的,并且有非常多的规则(约 2500 万条)。旧规则是 if 语句,例如

如您所见,旧规则通常甚至不使用某些功能或接受范围。有些更烦人:

规则集需要小得多,因为它必须由人工维护,所以我想缩小规则集,以便第一个示例变为:

结果是我们可以通过 Result 列拆分规则集并分别收缩。但是,我想不出一种简单的方法来识别和缩小规则集。我尝试过聚类算法,但由于某些数据是离散的,因此它们会窒息,并且将其视为连续数据是不完美的。另一个例子:

在理想的世界中,这将是两个规则:

即:算法不仅会识别 A 和 B 之间的关系,还会推断出 C 是噪声(对规则不重要)

有谁知道如何解决这个问题?任何语言或库都是公平的游戏,因为我希望这主要是一次性的过程。提前致谢。

0 投票
2 回答
1112 浏览

excel - 如何让用户在 Excel 中指定多级类别?

我正在使用 Excel 2007 开发一种模板。用户将使用它来创建属于 3 级类别的记录。用户应该能够创建新类别、指定现有类别或不指定。一条记录可能属于多个类别。

我想知道我最好的选择是向用户展示类别结构。类别用作标签,因此基本上不需要 VBA 编程。Excel 中是否有适合这种情况的控件或功能?

0 投票
9 回答
3759 浏览

c# - C#:有没有办法对枚举进行分类?

给定以下枚举:

是否可以对命名常量进行分类,以便我可以将“Quarterback”和“Runningback”标记为进攻位置,将“DefensiveEnd”和“Linebacker”标记为防守位置?

0 投票
2 回答
5296 浏览

text - 专有名词列表?

我正在尝试从文本 blob 中过滤名称。目前我只是生成一个单词列表并手动过滤它,但我有大约 8k 个单词要走,所以我正在寻找更好的方法。我可以拿一本字典并将它们过滤掉,但这会剔除史密斯和悬崖之类的名字。

我需要的是以下任一:

  • 常用名称列表(我需要 >5k 最常用的名称)
  • 也恰好是单词的名称列表

我想在他们之间,我可以做一个组合的黑名单/白名单来获得我需要的东西。

0 投票
2 回答
186 浏览

statistics - 对传入数据的新趋势进行盲目分类

像谷歌新闻这样的新闻媒体如何自动对有关新兴话题的文档进行分类和排名,比如“奥巴马的 2011 年预算”?

我有一堆带有棒球数据标签的文章,例如球员姓名和与文章的相关性(谢谢,opencalais),并且很想创建一个谷歌新闻风格的界面,在新帖子出现时对其进行排名和显示,尤其是新兴的帖子话题。我想可以用一些静态类别来训练一个朴素的贝叶斯分类器,但这并不能真正允许跟踪诸如“这个球员刚刚被交易到这支球队,其他球员也参与其中”这样的趋势。