4

是否有在 mac 上运行的 shell 脚本从文本文件生成单词列表,列出唯一的单词?如果它可以按频率排序就更好了......

抱歉忘了提,是的,我更喜欢 bash 的,因为我现在正在使用 mac ......

哦,我的文件是法语的...(基本上我正在阅读一本小说并学习法语,所以我尝试生成一个单词列表来帮助自己)。希望这不是问题?

4

3 回答 3

3

如果我理解正确,你需要这样的东西:

cat <filename> | sed -e 's/ /\n/g' | sort | uniq -c
于 2012-04-30T15:35:24.883 回答
2

这个命令会做

cat file.txt |  tr "\"' " '\n' | sort -u

此处sort -u不适用于 Macintosh 机器。在这种情况下,请sort | uniq -c改用。(感谢汉克盖伊

cat file.txt |  tr "\"' " '\n' | sort | uniq -c 
于 2012-04-30T15:40:32.400 回答
1

只需回答我的问题以点下我正在使用的最终版本:

tr -cs "[:alpha:]" "\n" < FileIn.txt | sort | uniq -c | awk '{print $2","$1}' >> FileOut.csv

一些注意事项:

  • tr 可以直接用来做替换。
  • 因为我有兴趣为我的法语词汇创建一个单词列表,所以我使用了 [:alpha:]
  • awk用来插入逗号,这样输出的是csv文件,方便我上传...

再次感谢大家帮助我。

抱歉,我在开始时没有明确说明我正在使用 mac 并期望使用 bash 脚本。

干杯。

于 2012-04-30T16:29:32.943 回答