当您不知道正确的术语时,很难搜索:-(
我被要求查看一个潜在的分类应用程序,其中并非所有可用数据都与每个分类相关,但所有类型的数据都与至少某些项目类别的分类相关。
例如,您可以想象一个考古挖掘机器人,它需要对它发现的所有东西进行绝对分类。“绝对一切”是指它筛选的土壤、粘土和沙子的类型,它发现的不同类型的岩石、鹅卵石和陶片,它发现的真菌、细菌和土壤生命的类型,以及所有可能更直接地与该地区以前的人类活动有关。
所以你可能有 DNA 或其他分析来告诉你这些骨头是人的还是动物的,这也适用于细菌和真菌,但根本不适用于沙子、粘土和石头。请注意,任何类型的数据始终可用于分析然后分类的每个项目,但当它与项目分类无关时,可能是某种嘈杂的空值。即没有依据预先分类,选择性地生成相关数据。所以数据是统一生成的,但相关性不统一。这就是我所说的“非同质”。
如果我能找出这叫什么,那么我可能有更好的机会找到解决问题的方法以及哪些分类技术可能是合适的。“它被称为 X 并且在 [link] 上有关于它的建设性讨论”形式的答案会很棒:-)