0

我正在用 erlang 卷曲一个网页,自然而然地得到了 html 代码,到目前为止一切都很好!这就是我的代码的样子:

startCURL()->
Cmd = "curl \"" ++ "http://mywebsite.com/something.html" ++ "\"",
Output = os:cmd(Cmd),
io:format("The HTML output: ~s~n", [Output]).

现在到了这个问题,我想通过 erlang 排除 html 中的各种标签。示例: <b>Hello </b>to "Hello" 没有<b>and </b>

我真的很感激我能得到的所有帮助!谢谢!

4

2 回答 2

1

您可以使用re 模块中的替换功能将不需要的标签替换为空字符串。

re:replace(Output, "</?br>", "", [global]). 
于 2012-10-04T14:44:46.380 回答
0

这篇博文展示了如何使用mochiweb_htmlHTML 文档进行各种技巧。希望这足以让你开始。

于 2012-10-03T14:02:43.807 回答