我希望这是与程序员相关的问题。我从事 C# 编程的业余爱好。出于我自己的目的,我需要解析 html 文件,最好的想法是..正则表达式。正如许多人发现的那样,学习它们非常耗时,因此如果您知道一些能够接受输入的应用程序(任何代码),了解我需要什么(通过我选择一个我需要“删除”的代码),并为我提供正确的正则表达式或更多选项。
正如我所听说的,Regex 本身就是一门小科学,所以它可能不像我想象的那么容易。
我希望这是与程序员相关的问题。我从事 C# 编程的业余爱好。出于我自己的目的,我需要解析 html 文件,最好的想法是..正则表达式。正如许多人发现的那样,学习它们非常耗时,因此如果您知道一些能够接受输入的应用程序(任何代码),了解我需要什么(通过我选择一个我需要“删除”的代码),并为我提供正确的正则表达式或更多选项。
正如我所听说的,Regex 本身就是一门小科学,所以它可能不像我想象的那么容易。
是的,罗伊·奥舍罗夫(Roy Osherove)写的正是您要找的东西-regulazy
不是您的问题的真正答案,因为它与正则表达式无关,但HtmlAgilityPack可以帮助您进行解析。
您可能还想尝试 txt2re : http://txt2re.com/,它尝试识别用户提供的字符串中的模式并允许从中构建正则表达式。
我必须同意 Sunny 在这一点上:如果您正在解析 html,最好将其转换为 XML(使用 HTML Agility 包非常简单),然后您可以使用 XPATH 表达式而不是正则表达式,这要好得多适合这份工作。