11

我需要以 .csv 格式输出我的 hadoop 结果。我将如何做到这一点?我的代码:https ://github.com/studhadoop/xml/blob/master/XmlParser11.java

我应该在我的代码中简单地包含 csvoutputFormat 吗?我正在使用 mapreduce API

我的工作.sh

bin/hadoop jar /var/root/ALA/ala_jar/clsperformance.jar ala.clsperf.ClsPerf /user/root/ala_xmlrpt/Amrita\ Vidyalayam\,\ Karwar_Class\ 1\ B_ENG.xml  /user/root/ala_xmlrpt-outputshell4

bin/hadoop fs -get /user/root/ala_xmlrpt-outputshell4/part-r-00000 /Users/jobsubmit


cat /Users/jobsubmit/part-r-00000 /Users/jobsubmit/output.csv

解决方案

是的,我失踪了>在猫

cat /Users/jobsubmit/part-r-00000> /Users/jobsubmit/output.csv
4

1 回答 1

15

您可以使用 TextOutputFormat。默认的键/值分隔符是制表符。您可以通过在驱动程序中设置属性“mapred.textoutputformat.separatorText”来更改分隔符。

conf.set("mapred.textoutputformat.separatorText", ",");
于 2013-05-02T04:57:25.427 回答