问题标签 [categorization]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
macos - Character Viewer 的分类数据在 OS X 上保存在哪里?
我的意思是这件事:
我想在我的项目中使用相同的字符分类。
text - 如何使用 weka 进行术语提取?
我需要从大型训练语料库中提取特定领域的术语,例如政治术语等。我如何使用 Weka 及其过滤器来瞄准这个对象?我可以使用 Weka 中的过滤器生成的特征向量StringToVector()
来执行此操作吗?
java - 如何根据字符串的值对字符串进行分类
我正在尝试使用 Java 编程获取一个字符串并将其划分为类别(书籍、食品和医疗用品)。这真的让我很困惑,因为字符串几乎没有自动机。字符串只有一个单词,但英语中有很多单词。我有什么策略可以实施吗?
machine-learning - 哪个斯坦福 NLP 包用于内容分类
我的表中有大约 5000 个术语,我想将它们分组到有意义的类别中。
例如,一些术语是:
日产
福特
被捕
吉普车
法庭
结果应该是 Nissan、Ford、Jeep 归为一类,而 Arrested 和 Court 归为另一类。我查看了斯坦福分类器 NLP。我是否正确地认为这是选择为我做这件事的正确人?
python - NLTK 分类和 WordNet with Text Blob
我有以下两组。这个想法是能够根据我提供的一些元标签对新闻文章进行分类。例如,当我收到一篇包含“法官”“5 年”的文章时,它应该被归类为犯罪故事
问题是当我运行这个时:
它将一切归类为“汽车”
我确定我在这里错过了语义相似性比较。我尝试通过文本 blob 使用 WordNet。
我跑了
但它没有给我任何结果。
现在的问题是:
我如何让 WordNet 说大众汽车是汽车,将其集成到分类器中,以便它意识到现代也是汽车并正确分类?
python - 带有 scikit onehotencoder 的向量上的虚拟变量
假设我有一个整数向量,其中每个整数对应一个类别:
我知道我有多少类别。这个向量是我的 X 数据集的列之一,它将以逻辑回归模型结束。
是否可以使用 sciki-tlearn 函数onehotencoder来获得类似的东西:
0 0 0 1(当 1)
0 0 1 0(当 2)
0 1 0 0(当 3)
1 0 0 0(当任何时候)
甚至更好
0 0 0
0 0 1
0 1 0
1 0 0
?
当我尝试将这样的向量传递给 onehotencoder 时,我收到此错误:need more than 1 value to unpack
.
此外:我想如果我有“NULL”记录,我应该首先将它们转换为一个数字:有没有一种快速的方法来做到这一点,比如A(find(A=='NULL'))=123
?
谢谢您的帮助。弗朗切斯科
magento - Magento CE 上的分类策略
我目前正在 Magento CE 上定义我的产品分类。
我们的目录很大,我们已经定义了许多自定义属性(性别、类型、颜色)。我现在需要创建类别。
客户应以不同的方式浏览目录。
示例 1,客户对女性的“类型 1”产品感兴趣,他将有 2 个主要途径来访问该信息:1)转到“类型 1”类别(点击主菜单),然后检查性别属性中的女性属性(左侧的分层导航)。呈现的 url 将是 www.myshop.com/type-1.html。对于这种情况,我将无法为此“type-1/woman”显示(产品列表的横幅顶部)定义静态块。2)转到“类型1”并子链接“女人”(在主菜单上)。现在登陆页面不同了,生成的url是www.myshop.com/type-1/woman.html。但我将能够为该类别定义一些特定的静态块。
考虑到这一点,我想我必须根据类型创建第一个类别级别,然后在每种类型上,我将为“性别”创建一个子类别级别,然后在每个性别类别上,我必须创建类别基于其他属性的“颜色”。
这是处理类别的正确方法吗?或者我应该通过另一种方式来管理它(对 seo 不太友好),例如:http ://amasty.com/improved-layered-navigation.html
注意:我买了很多关于 mangento 的书,但其中任何一本都给出了关于这种要求的特定结构......
r - R中的向量分类和分配
这可能是一个非常简单的问题,但我无法在任何地方找到答案。我有一个基本的数据框:
这有效:
但这不会:
如您所见,所有行都采用第一行收到的值。我以为您可以进行矢量运算并一次设置整个列的值,ifelse
但是我在这里做错了什么。即使是复杂/嵌套if/else if/else
的语句也会做同样的事情。
谢谢!
python - 在python中分类和计算一些东西
我有以下输入文件
……
首先,我希望根据第 4 列对这些数据进行分类,例如 [0~1, 1~2, 2~3, ...., max-1 ~ max] 然后统计 'Si' 和 ' 的数量O' 在每个部分。之后,根据这些数字进行一些计算,然后打印出来。打印格式设置为
划分了三个空间后,我尝试使用嵌套的 for 循环,但失败了。
像这样的东西,但我卡在中间。我听说 numpy、csvanal 或其他函数可以轻松做到这一点,但我不知道它们。
r - 使用 mutate 对数值变量进行分类
我想对我的data.frame
对象中的数字变量进行分类dplyr
(并且不知道该怎么做)。
没有dplyr
,我可能会做类似的事情:
它会完成的。但是,我非常喜欢dplyr
在mutate
我chain
对data.frame
.