0

我需要阅读 HTML 文本中的 INI 文本,并使用 Visual Basic 2010 获取 INI 的每个部分。

但它是在网站内部,它包含前后甚至内部的 HTML 标签,如下所示:

... more HTML
<div ... >
[inipart1]<br />
param1=1<br />
param2=text<br />
param3=Yes<br />
param4=link<br />
[inipart2]<br />
param1=1<br />
param2=text<br />
param3=Yes<br />
param4=link
</div>
... more HTML

我需要删除所有 HTML 部分(所有之前和之后)并像任何其他 INI 文件一样读取 INI 部分;我需要把它变成这样:

[inipart1]
param1=1
param2=text
param3=Yes
param4=link
[inipart2]
param1=1
param2=text
param3=Yes
param4=link

谁能帮我?非常感谢。

4

2 回答 2

1

试试这个:

public string StripHtml(string text)
{
    return Regex.Replace(text, @"<(.|\n)*?>", "");
}

PS:您必须包含 System.Text.RegularExpressions 命名空间

于 2013-06-25T11:53:47.133 回答
1

如果您可以确定 INI 值或参数不包含任何大于或小于符号,则可以编写一个过滤掉所有 HTML 标记的正则表达式。

于 2013-06-25T11:56:02.027 回答