我写了一个hadoop程序,我知道我可以直接将参数传递给hadoop使用args [],我的意思是目前是这样的
ToolRunner.run(new Configuration(), new RunDear(), args);
但是如果有很多参数,我可以制作一个像下面这样的配置文件并传递给hadoop吗?这个文件应该在哪里,在本地文件系统或 hdfs 中?
sample_size 200
input_genotype_file /data/genotypes.txt
input_phenotype_file /data/phenotypes.txt
output_directory /outout
mtry 200
ntree 3000
distance 0 (e.g. 0=euclidean, 1=mehalanobis
variable_important 0 (e.g. 0=information gain, 1=permutation)
etc….