我提出这个要求:
http://en.wikipedia.org/w/api.php?format=xml&action=query&titles=self-administration&prop=revisions&rvprop=content&rvparse=&rvsection=0
我的目标是从文章的介绍中获取纯文本。
它在 XML 文件中返回了一些 HTML。在删除引用之后strip_tags
,preg_replace,
我得到了这个:
自我给药,在医学意义上,是受试者向他、她或自己给予药理学物质的过程。[...] 引用错误:此页面上有标签,但如果没有 {{Reflist}} 模板或标签,引用将不会显示;请参阅帮助页面。
我想删除
引用错误:此页面上有标签,但如果没有 {{Reflist}} 模板或标签,引用将不会显示;请参阅帮助页面。
如何使用 php(preg_replace
?)或在我的初始查询(忽略错误?)中解决这个问题。