0

我提出这个要求:

http://en.wikipedia.org/w/api.php?format=xml&action=query&titles=self-administration&prop=revisions&rvprop=content&rvparse=&rvsection=0

我的目标是从文章的介绍中获取纯文本。

它在 XML 文件中返回了一些 HTML。在删除引用之后strip_tagspreg_replace,我得到了这个:

自我给药,在医学意义上,是受试者向他、她或自己给予药理学物质的过程。[...] 引用错误:此页面上有标签,但如果没有 {{Reflist}} 模板或标签,引用将不会显示;请参阅帮助页面。

我想删除

引用错误:此页面上有标签,但如果没有 {{Reflist}} 模板或标签,引用将不会显示;请参阅帮助页面。

如何使用 php(preg_replace?)或在我的初始查询(忽略错误?)中解决这个问题。

4

1 回答 1

1
$bad = ' <br /><strong class="error">Cite error: There are <code>&lt;ref&gt;</code> tags on this page, but the references will not show without a <code>&#123;&#123;Reflist&#125;&#125;</code> template or a <code>&lt;references /&gt;</code> tag; see the <a href="/wiki/Help:Cite_errors/Cite_error_refs_without_references" title="Help:Cite errors/Cite error refs without references">help page</a>.</strong> ';

$good = str_replace($bad, '', $intro);
于 2012-12-30T21:47:38.690 回答