我正在寻找一个可以使用公式将输入数据转换为模型矩阵的 Java 库。该公式不是一个简单的算术方程,而是描述变量之间的相互作用,将分类变量映射到适当的数值范围,并在输入向量/矩阵上生成变换。
例如,R 具有以下model.matrix
功能,它允许您通过描述高级变量之间的交互来转换输入数据formula
。
R中的简单示例
输入数据:
electric_usage,temperature,time_of_day
30,85,morning
35,80,evening
公式:
electric_usage ~ temperature * time_of_day
这是公式的简写:
electric_usage ~ temperature + time_of_day + (temperature : time_of_day)
例如,在 R 中:
> model.matrix(
electric_usage ~ temperature * time_of_day,
data.frame(
electric_usage=c(30,35),
temperature=c(85,80),
time_of_day=c("morning", "evening")
)
)
(Intercept) temperature time_of_daymorning temperature:time_of_daymorning
1 85 1 85
1 80 0 0
请参阅 R 文档: http ://stat.ethz.ch/R-manual/R-patched/library/stats/html/model.matrix.html