当我datasource
通过下面的 python 脚本创建一个时,我的至少一个属性有 100% 的缺失值。当我datasource
通过 AWS ML 控制面板手动创建并应用相同的属性类型时,没有一个值丢失。我如何从 s3 创建数据源有问题吗?
file_names = [file_name_train, file_name_testing]
client = boto3.client('machinelearning')
schema_file = open('../Selections/aws_schema.txt', 'r')
schema = schema_file.read()
for file_name in file_names:
response = client.create_data_source_from_s3(
DataSourceId=file_name+date,
DataSourceName=file_name+date,
DataSpec={
'DataLocationS3': 's3://'+bucket_name+'/'+file_name+file_extension,
'DataSchema': schema,
},
ComputeStatistics=True
)