1

我觉得这应该是一个如此简单的“更改逗号”,所以我已经完成了我的研究并尝试了许多不同的东西,但似乎没有任何效果。首先是我用来调试它的代码:

/* More code before */

$Test = "This is a test <ul>TEST</ul> Blabla";
$Real = $Data['chapters']['introduction'];
var_dump($Real);
echo "\n\n";

preg_match('/<ul>(.*)<\/ul>/', $Test, $VarTest);
var_dump($VarTest);
echo "\n\n";

preg_match('/<ul>(.*)<\/ul>/', $Real, $VarReal);
var_dump($VarReal);

结果是这样的:

string(1888) "<p>The <b>theory of relativity</b>, or simply <b>relativity</b>, generally encompasses two theories of <a href="http://en.wikipedia.org/wiki/Albert_Einstein" title="Albert Einstein">Albert Einstein</a>: <a href="http://en.wikipedia.org/wiki/Special_relativity" title="Special relativity">special relativity</a> and <a href="http://en.wikipedia.org/wiki/General_relativity" title="General relativity">general relativity</a>. Concepts introduced by the theories of relativity include:</p>
<ul>
  <li>
    <p>Measurements of various quantities are <i>relative</i> to the velocities of observers. In particular, space and time can <a href="http://en.wikipedia.org/wiki/Time_dilation" title="Time dilation">dilate</a>.</p>
  </li>
  <li>
    <p><a href="http://en.wikipedia.org/wiki/Spacetime" title="Spacetime">Spacetime</a>: space and time should be considered together and in relation to each other.</p>
  </li>
  <li>
    <p>The speed of light is nonetheless invariant, the same for all observers.</p>
  </li>
</ul>
<p>The term &quot;theory of relativity&quot; was based on the expression &quot;relative theory&quot; (<a href="http://en.wikipedia.org/wiki/German_language" title="German language">German</a>: <span lang="de"><i>Relativtheorie</i></span>) used by <a href="http://en.wikipedia.org/wiki/Max_Planck" title="Max Planck">Max Planck</a> in 1906, who emphasized how the theory uses the <a href="http://en.wikipedia.org/wiki/Principle_of_relativity" title="Principle of relativity">principle of relativity</a>. In the discussion section of the same paper <a href="http://en.wikipedia.org/wiki/Alfred_Bucherer" title="Alfred Bucherer">Alfred Bucherer</a> used for the first time the expression &quot;theory of relativity&quot; (<a href="http://en.wikipedia.org/wiki/German_language" title="German language">German</a>: <span lang="de"><i>Relativit&auml;tstheorie</i></span>).</p>
"

array(2) {
  [0]=>
  string(13) "<ul>TEST</ul>"
  [1]=>
  string(4) "TEST"
}


array(0) {
}

关于为什么最后一个数组为空的任何想法(当它应该包含 3 个列表元素时)?

更多信息,它是使用 PDO 从 MySQL 检索的,我尝试转义它(对于引号),替换引号,检查此文本大小是否低于 preg_match() 字符串限制,我只是找不到问题是。我认为代码本身就说明了问题所在,无论如何,我很乐意执行您需要的测试。谢谢。

4

3 回答 3

3

您在这里遇到的最大问题是您正在尝试使用正则表达式解析 HTML 代码。即使你可以让它与你拥有的数据一起工作,一旦数据包含嵌套<ul>标签,你的正则表达式就会崩溃,到那时让它工作变得非常困难。解析 HTML 确实应该使用 DOM 解析器(即 PHP 的 DOMDocument 类)来完成。正则表达式是不适合这项工作的工具。

也就是说,如果您必须使用正则表达式,则需要使用s修饰符,因为输入跨越多行。此修饰符更改正则表达式中点字符的行为,使其包含换行符。

所以你的最终模式需要看起来像这样:

preg_match('/<ul>(.*)<\/ul>/s', $Real, $VarReal);

希望有帮助。

于 2013-05-19T20:32:47.043 回答
2

第二种情况下的正则表达式是多行的。将“m”附加到您的函数调用中:

preg_match('/<ul>(.*)<\/ul>/m', $Real, $VarReal);
于 2013-05-19T20:20:51.950 回答
1

我使用了一些修改SO答案的代码;但是我通过检查其他一些答案并查看 Patrice Levesque 的答案找到了解决方案。根据这个问题,我在函数调用中使用了“s” :

preg_match('/<ul>(.*)<\/ul>/s', $Real, $VarReal);
于 2013-05-19T20:31:08.560 回答