您没有说出您要做什么,总体而言,这实际上取决于您是从业者(其他领域的专家)还是机器学习专家。无论如何,您可以查看所有类型的内容:
一维是深度或难度:
-基础:处理简单的方法和编程错误。介于 0 和 1(或 -1 和 1)之间的特征、交叉验证以获得良好的超参数值(在 SVM 的情况下为 C 和 gamma)以及许多其他细节:这个问题很好地涵盖了它们:Supprt Vector Machine works in matlab, does不能在 C++ 中工作
-中级:处理更深层次的概念错误。重新审视数据的质量和数量,审查您使用的分类器类型,例如线性与非线性,生成与判别,检查文献以了解其他人使用与您相似的方法在相同数据上获得的结果。考虑您正在对其他类型的数据(源-目标问题)进行某种类型的数据测试的可能性。关键词:领域适应、多任务学习、正则化等。
-高级:你已经用尽了所有的可能性,你需要推进最先进的技术来解决你的问题。您需要更快的算法。您需要用更少的数据获得稳健的结果,或者您需要处理更大规模的数据。研究最先进的解决方案并推动它们前进。此外,有时进步不是那么进化/增量,有时你需要采取另一条路线,消除假设等。
这种分类主要是正交的,但也很有用:
-专家知识:有时(如您链接的情况)非常难以处理的问题(NLP,视觉)可以使用专家知识来解决。例如,在人脸识别中,人们根据神经科学的结果使用面部的某些区域(眼睛周围)来识别个人,结果表明这是人类所关注的。大多数(如果不是全部)有用的表示方法,如 SIFT、SURF、LBP 都具有人类视觉的一些基础。此外,在您链接的示例中,语言学家提出了在 NLP 的 ML 方法中使用的表示:文本分类的特征选择和减少。