find - Grep/Find/Xargs：在文件夹中的两个字符串或 Wget 的结果之间搜索

Question

我有一个充满 html 文件的文件夹。

score 0 · Accepted Answer

将 HTML 中的文本抓取到文件中：如果您的 grep 版本支持它，-o开关会告诉它只打印该行的匹配部分。

考虑到这一点，2 次grep调用应该可以解决您的问题（前提是您只能唯一标识您希望获取文本的行）；像这样的东西：

grep -Rn "var topicName =" html/ | grep -o '"[^"]*"' > topicNames.dat

如果将 " 符号留在其中是不可接受的，则可以在第二个 grep 之后通过 sed 传递它：

grep -Rn "var topicName =" html/ | grep -o '"[^"]*"' | sed 's/"//g' > topicNames.dat

1 回答 1