我正在使用 Orange(在 Python 中)执行一些数据挖掘任务。更具体地说,用于聚类。尽管我已经阅读了教程并阅读了大部分文档,但我仍然有一个问题。文档和教程中的所有示例都假设我有一个制表符分隔的表格,其中包含数据。但是,没有什么可以说明如何从头开始创建新表。例如,我想为不同文档中的词频创建一个表。
也许我错过了一些东西,所以如果有人有任何见解,将不胜感激。
谢谢乔治
编辑:
这就是我创建表的方式
#First construct the domain object (top row)
vars = []
for var in variables:
vars.append(Orange.data.variable.Continuous(str(var)))
domain = Orange.data.Domain(vars, classed) #The second argument indicated that the last attr must not be a class
#Add data rows assuming we have a matrix
t = Orange.data.Table(domain, matrix)