bash - 从 Linux 终端获取网页标题、图片、元数据信息

Question

有没有什么方法或工具可以用来从 SH 脚本、网页标题、描述等元数据、网页的小屏幕截图或类似的东西中获取？

提前致谢！

score 2 · Accepted Answer

您可以使用 curl 或 wget 获取网页，然后将其通过管道传输到 sed 以获取各种标签的内容。它像.

例如

wget http://example.com -O - | grep \<title\>|sed "s/\<title\>\([^<]*\).*/\1/"

会给你标题标签的内容。请注意，在此示例中，它为您提供了未解析的原始源，因此它看起来像IANA — Example domains而不是IANA – Example domains.

您是否考虑过使用 perl 之类的东西？

1 回答 1