我刚刚开始使用流集,并且正在尝试将文本文件从本地加载到 HDFS。请注意:我使用的是 Cloudera Manager,这是“core-site.xml”的视图:
<property>
<name>hadoop.ssl.server.conf</name>
<value>ssl-server.xml</value>
<final>true</final>
</property>
<property>
<name>hadoop.ssl.client.conf</name>
<value>ssl-client.xml</value>
<final>true</final>
</property>
<property>
<name>hadoop.proxyuser.sdc.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.sdc.groups</name>
<value>*</value>
</property>
</configuration>
本地文件是存储在“/home/cloudera/Desktop”中的文本文件。
这是 Streamsets 中源(本地)配置的视图:
这是 Streamsets 中 Hadoop fs 配置的视图:
验证成功!
播放完管道后,我应该在我指定的 HDFS 目录中找到该文件,尤其是在“/user/cloudera”。
但是当我运行它时,文件还没有加载。
我确定我错过了一些东西,我找不到答案。能否请你帮忙!
谢谢,