我正在尝试解析一个相当简单的网页以获取 shell 脚本中的信息。我现在使用的网页是在这里生成的。例如,我想将有关 Internet 服务提供商的信息提取到 shell 变量中。为此目的使用 xmllint、XMLStarlet 或 xpath 程序之一可能是有意义的。我对 shell 脚本非常熟悉,但我对 XPath 语法和用于实现 XPath 语法的实用程序不熟悉,因此我希望能得到一些正确方向的指点。
这是 shell 脚本的开头:
HTMLISPInformation="$(curl --user-agent "Mozilla/5.0" http://aruljohn.com/details.php)"
# ISP="$(<XPath magic goes here.>)"
为方便起见,这里有一个用于在线动态测试 XPath 语法的实用程序: