问题标签 [categorization]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
166 浏览

macos - Character Viewer 的分类数据在 OS X 上保存在哪里?

我的意思是这件事: 在此处输入图像描述

我想在我的项目中使用相同的字符分类。

0 投票
1 回答
214 浏览

text - 如何使用 weka 进行术语提取?

我需要从大型训练语料库中提取特定领域的术语,例如政治术语等。我如何使用 Weka 及其过滤器来瞄准这个对象?我可以使用 Weka 中的过滤器生成的特征向量StringToVector()来执行此操作吗?

0 投票
2 回答
1094 浏览

java - 如何根据字符串的值对字符串进行分类

我正在尝试使用 Java 编程获取一个字符串并将其划分为类别(书籍、食品和医疗用品)。这真的让我很困惑,因为字符串几乎没有自动机。字符串只有一个单词,但英语中有很多单词。我有什么策略可以实施吗?

0 投票
2 回答
219 浏览

machine-learning - 哪个斯坦福 NLP 包用于内容分类

我的表中有大约 5000 个术语,我想将它们分组到有意义的类别中。

例如,一些术语是:

日产

福特

被捕

吉普车

法庭

结果应该是 Nissan、Ford、Jeep 归为一类,而 Arrested 和 Court 归为另一类。我查看了斯坦福分类器 NLP。我是否正确地认为这是选择为我做这件事的正确人?

0 投票
2 回答
1617 浏览

python - NLTK 分类和 WordNet with Text Blob

我有以下两组。这个想法是能够根据我提供的一些元标签对新闻文章进行分类。例如,当我收到一篇包含“法官”“5 年”的文章时,它应该被归类为犯罪故事

问题是当我运行这个时:

它将一切归类为“汽车”

我确定我在这里错过了语义相似性比较。我尝试通过文本 blob 使用 WordNet。

我跑了

但它没有给我任何结果。

现在的问题是:

我如何让 WordNet 说大众汽车是汽车,将其集成到分类器中,以便它意识到现代也是汽车并正确分类?

0 投票
1 回答
2258 浏览

python - 带有 scikit onehotencoder 的向量上的虚拟变量

假设我有一个整数向量,其中每个整数对应一个类别:

我知道我有多少类别。这个向量是我的 X 数据集的列之一,它将以逻辑回归模型结束。

是否可以使用 sciki-tlearn 函数onehotencoder来获得类似的东西:

0 0 0 1(当 1)
0 0 1 0(当 2)
0 1 0 0(当 3)
1 0 0 0(当任何时候)

甚至更好

0 0 0
0 0 1
0 1 0
1 0 0

?

当我尝试将这样的向量传递给 onehotencoder 时,我收到此错误:need more than 1 value to unpack.

此外:我想如果我有“NULL”记录,我应该首先将它们转换为一个数字:有没有一种快速的方法来做到这一点,比如A(find(A=='NULL'))=123

谢谢您的帮助。弗朗切斯科

0 投票
1 回答
840 浏览

magento - Magento CE 上的分类策略

我目前正在 Magento CE 上定义我的产品分类。

我们的目录很大,我们已经定义了许多自定义属性(性别、类型、颜色)。我现在需要创建类别。

客户应以不同的方式浏览目录。

示例 1,客户对女性的“类型 1”产品感兴趣,他将有 2 个主要途径来访问该信息:1)转到“类型 1”类别(点击主菜单),然后检查性别属性中的女性属性(左侧的分层导航)。呈现的 url 将是 www.myshop.com/type-1.html。对于这种情况,我将无法为此“type-1/woman”显示(产品列表的横幅顶部)定义静态块。2)转到“类型1”并子链接“女人”(在主菜单上)。现在登陆页面不同了,生成的url是www.myshop.com/type-1/woman.html。但我将能够为该类别定义一些特定的静态块。

考虑到这一点,我想我必须根据类型创建第一个类别级别,然后在每种类型上,我将为“性别”创建一个子类别级别,然后在每个性别类别上,我必须创建类别基于其他属性的“颜色”。

这是处理类别的正确方法吗?或者我应该通过另一种方式来管理它(对 seo 不太友好),例如:http ://amasty.com/improved-layered-navigation.html

注意:我买了很多关于 mangento 的书,但其中任何一本都给出了关于这种要求的特定结构......

0 投票
0 回答
157 浏览

r - R中的向量分类和分配

这可能是一个非常简单的问题,但我无法在任何地方找到答案。我有一个基本的数据框:

这有效:

但这不会:

如您所见,所有行都采用第一行收到的值。我以为您可以进行矢量运算并一次设置整个列的值,ifelse但是我在这里做错了什么。即使是复杂/嵌套if/else if/else的语句也会做同样的事情。

谢谢!

0 投票
1 回答
164 浏览

python - 在python中分类和计算一些东西

我有以下输入文件

……

首先,我希望根据第 4 列对这些数据进行分类,例如 [0~1, 1~2, 2~3, ...., max-1 ~ max] 然后统计 'Si' 和 ' 的数量O' 在每个部分。之后,根据这些数字进行一些计算,然后打印出来。打印格式设置为

划分了三个空间后,我尝试使用嵌套的 for 循环,但失败了。

像这样的东西,但我卡在中间。我听说 numpy、csvanal 或其他函数可以轻松做到这一点,但我不知道它们。

0 投票
2 回答
34966 浏览

r - 使用 mutate 对数值变量进行分类

我想对我的data.frame对象中的数字变量进行分类dplyr(并且不知道该怎么做)。

没有dplyr,我可能会做类似的事情:

它会完成的。但是,我非常喜欢dplyrmutatechaindata.frame.