在为模型配置公平性监控时,即使预测标签是分类的,预测列也只允许整数值,这是预期的功能吗?如何为分类特征(不是整数)配置它?是否需要手动转换?
1 回答
训练数据可以具有诸如“贷款被拒绝”、“贷款被授予”之类的类标签。WML评分端点返回的预测值有“0.0”、“1.0”等值。评分端点还有一个可选列,其中包含预测的文本表示。例如,如果prediction=1.0,predictionsLabel列可以有一个值“Loan Granted”。如果这样的列可用,那么在为模型配置有利和不利的结果时,您可以指定字符串值“Loan Granted”和“Loan Denied”。如果这样的列不存在如果可用,那么您需要指定 1.0 的整数/双精度值,0.0 为 favourable/unfavourable 类。
WML 有一个输出模式的概念,它定义了 WML 评分端点的输出模式以及不同列的作用。这些角色用于识别哪一列包含预测值,哪一列包含预测概率,以及类标签值等。输出模式是为使用模型构建器创建的模型自动设置的。也可以使用 WML python 客户端进行设置。用户可以使用输出模式来定义一个包含预测字符串表示的列。这是通过将列的modeling_role 设置为“decoded-target”来完成的。WML python 客户端的文档位于:http ://wml-api-pyclient-dev.mybluemix.net/#repository. 搜索“OUTPUT_DATA_SCHEMA”以了解输出模式,使用的 API 是 store_model API,它接受 OUTPUT_DATA_SCHEMA 作为参数。