1

我已经上传了我的数据 genotype1_large_ind_large.txt phenotype1_large_ind_large_1.txt

到 S3 系统,在 EMR UI 中,我设置如下参数

RunDear.run s3n://scalability/genotype1_large_ind_large.txt s3n://scalability/phenotype1_large_ind_large_1.txt s3n://scalability/output_1phe 33 10 4

在我的 RunDear.run 类中,我会将文件 genotype1_large_ind_large.txt 和 phenotype1_large_ind_large_1.txt 分发到缓存中

但是,运行 EMR 后,出现以下错误: java.io.FileNotFoundException: File does not exist: /genotype1_large_ind_large.txt

我想知道为什么文件名前面有斜杠'/'?如何使它工作?

我也尝试像下面这样使用,但我的程序会将 -cacheFile 作为参数,因此也不起作用,

RunDear.run -cacheFile s3n://scalability/genotype1_large_ind_large.txt#genotype.txt -cacheFile s3n://scalability/phenotype1_large_ind_large_1.txt#phenotype.txt s3n://scalability/output_1phe 33 280 4

4

1 回答 1

0

我终于意识到这是使用文件系统的问题,所以我在程序中添加了如下代码 FileSystem fs = FileSystem.get( URI.create("s3://scalability"), conf);

于 2012-05-02T12:24:54.077 回答