Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我在 hdfs 中有 pst 或电子邮件文件。现在,我想通过 hadoop 中最适合的组件进行文本分析。我该如何开始。
我是否必须首先从这些文件中提取实际内容并将其存储在某处(例如在文本文件中),然后对文本文件运行分析?
请建议我。
ps:我开始在谷歌搜索时遇到了这个。这是唯一的选择还是任何其他可用的解决方案。