我有一个充满 html 文件的文件夹。
user971580
问问题
335 次
1 回答
0
将 HTML 中的文本抓取到文件中:如果您的 grep 版本支持它,-o
开关会告诉它只打印该行的匹配部分。
考虑到这一点,2 次grep
调用应该可以解决您的问题(前提是您只能唯一标识您希望获取文本的行);像这样的东西:
grep -Rn "var topicName =" html/ | grep -o '"[^"]*"' > topicNames.dat
如果将 " 符号留在其中是不可接受的,则可以在第二个 grep 之后通过 sed 传递它:
grep -Rn "var topicName =" html/ | grep -o '"[^"]*"' | sed 's/"//g' > topicNames.dat
于 2012-08-12T19:38:53.727 回答