1

我有一些最初用 PHP 编写的正则表达式代码,我需要将其移植到 ASP。这是原始的PHP代码:

$contents = file_get_contents("http://localhost/source.txt");
$title =  'My Title';
preg_match("/<b>$title.*?(<p.*?)<\/td/smi",$contents,$matches);
print_r($matches);

这是 ASP 移植版本:

contents = File_Get_Contents("http://localhost/source.txt")
response.write contents
title = "My Title"
regex = "<b>" + title + ".*?(<p.*?)</td"
Set objRE2 = New RegExp
With objRE2
    .Pattern    = regex
    .IgnoreCase = True
    .Global     = True
    .MultiLine  = True
End With

Set myMatches = objRE2.Execute(contents)
'myMatches - Count is 0

Function File_Get_Contents(strFile)
    ' Remote File
    If Left(strFile, 7) = "http://" Or Left(strFile, 8) = "https://" Then
        'Set objXML = Server.CreateObject("Microsoft.XMLHTTP")
        ' Use this line if above errors
        Set objXML = Server.CreateObject("MSXML2.ServerXMLHTTP")
        objXML.Open "GET", strFile, False
        objXML.Send()
        File_Get_Contents = objXML.ResponseText
        Set objXML = Nothing
    ' Local File
    Else
        Set objFSO = Server.CreateObject("Scripting.FileSystemObject")
        Set objFile = objFSO.OpenTextFile(strFile, 1)
        File_Get_Contents = objFile.ReadAll()
        Set objFile = Nothing
        Set objFSO = Nothing
    End If
End Function

来源.txt:

<td>
<b>My Title</b><br>
<p>My Content</p></td>

如果我用两种语言写出实际的正则表达式模式,除了在 PHP 版本中转义正斜杠字符外,它是相同的。(我也测试过添加这个,效果相同)。

我缺少的正则表达式是否存在一些细微的差异,或者是我看不到的一些愚蠢的错误?

谢谢。

4

1 回答 1

2

.NET 和 PHP 正则表达式之间存在许多差异。1 . 然而,ASP-Classic 对正则表达式的使用要早得多,而且文档较少。

假设这篇Scripting Clinic文章Microsoft Beefs Up VBScript with Regular Expressions是正确的,那么您将需要重新编写您的表达式。

首先,不支持*?,??和的“最小匹配” +?


1比较掌握正则表达式(第 3)的表 9-1 和 10-1。

于 2012-07-26T10:29:30.327 回答