您可以使用 curl 或 wget 获取网页,然后将其通过管道传输到 sed 以获取各种标签的内容。它像.
例如
wget http://example.com -O - | grep \<title\>|sed "s/\<title\>\([^<]*\).*/\1/"
会给你标题标签的内容。请注意,在此示例中,它为您提供了未解析的原始源,因此它看起来像IANA — Example domains
而不是IANA – Example domains
.
您是否考虑过使用 perl 之类的东西?