This question shows research effort; it is useful and clear
0
This question does not show any research effort; it is unclear or not useful
Bookmark this question.
Show activity on this post.
我正在编写一个搜索引擎,它可以访问我公司所有附属网站,解析 html 并将它们存储在数据库中。这些网站非常老旧,在 100000 个网站中不符合 html 标准,大约 25% 的网站的 html 不好,难以解析。我需要编写可能修复错误 html 的 ac# 代码,然后解析内容或提出解决上述问题的解决方案。如果您有想法,实际的提示或代码片段会有所帮助。