我正在创建一个小算法来从网站获取文本..然后找到答案(完成后将发布脚本)。
为此,我需要将所有 HTML 代码转换为简单易读的英文文本。
我已经手动删除了所有 html 标签,但有些 css 条目很难摆脱。关于如何将 html 转换为纯英文文本的任何简单想法?
谢谢。
我正在创建一个小算法来从网站获取文本..然后找到答案(完成后将发布脚本)。
为此,我需要将所有 HTML 代码转换为简单易读的英文文本。
我已经手动删除了所有 html 标签,但有些 css 条目很难摆脱。关于如何将 html 转换为纯英文文本的任何简单想法?
谢谢。
我开发了类似的东西来避免正则表达式的性能损失:strip_tags 等效于 ASP.NET(也可以在桌面 .NET 程序集上运行)