3

我正在创建一个小算法来从网站获取文本..然后找到答案(完成后将发布脚本)。

为此,我需要将所有 HTML 代码转换为简单易读的英文文本。

我已经手动删除了所有 html 标签,但有些 css 条目很难摆脱。关于如何将 html 转换为纯英文文本的任何简单想法?

谢谢。

4

2 回答 2

5

有人已经为您完成了所有工作

于 2009-05-11T06:30:18.160 回答
0

我开发了类似的东西来避免正则表达式的性能损失:strip_tags 等效于 ASP.NET(也可以在桌面 .NET 程序集上运行)

于 2009-05-11T22:28:57.840 回答