-1

汽车制造商和模型有几个数据集。每个都包含数百个数据条目,如下所示:

奔驰 GLK 350 W2

普锐斯插电式混合动力高级丰田

通用别克君威 2012 GS 2.4L

如何仅使用这些文件将上述条目自动划分为制造商(例如 Toyota )和型号(例如 Prius Plug-in Hybrid Advanced)?

提前致谢。

4

1 回答 1

1

机器学习 (ML) 通常依赖于允许 ML 逻辑生成和验证基础数据模型的训练数据。有了这个模型,它就可以推断出提供给它的新数据的类别(在分类器应用程序中,就像手头的一样)或推断某个变量的值(在回归情况下,就像是,比如说,一个预测特定地区下个月降雨量的机器学习应用程序)。

问题中呈现的情况在几个层面上有点令人费解。
首先,汽车制造商的数量有限且相对较少。因此,很容易手动制作这些制造商的列表,然后简单地使用这个词典从型号中解析出制造商,使用纯字符串解析技术,即这里不需要甚至不需要 ML。(唉,人们将要使用的要求"...only those files"似乎排除了这个选项。
其次,人们可以想到一些可用于产生所需分类器的模式或启发式方法(暂时是一个相对较弱的分类器,作为模式/启发式方法来mind ATM 似乎相对不可靠)。此外,这种方法在这个词的普遍理解中也不是一种 ML 方法。

于 2012-11-11T08:05:41.060 回答