2

我正在从 Wikipedia API 获取一些图像元数据,但注意到文本可能会被截断。

在此页面上:
http ://en.wikipedia.org/w/api.php?action=query&prop=imageinfo&iiprop=comment&format=xml&titles=File:BrolinFoxFassbenderJonahHexJuly09.jpg

我只看到:

{{OTRS pending|year=2009|month=August|day=16}} {{Information
|Description={{en|Josh Brolin, Megan Fox, and Michael Fassbender promoting
the 2010 film ''Jonah Hex'' at San Diego Comic-Con.}} |Source=
http://www.flickr.com/photos/sdnatasha/3767292285/ |Date=

如果我查看文件的真实数据:http://commons.wikimedia.org/wiki/Special:Export/File:
BrolinFoxFassbenderJonahHexJuly09.jpg

我看到了完整的信息:

== {{int:filedesc}} =={{Information|Description={{en|Josh Brolin, Megan Fox,
and Michael Fassbender promoting the 2010 film ''Jonah Hex'' at San Diego
Comic-Con.}}|Source=
http://www.flickr.com/photos/sdnatasha/3767292285/|Date=2009-07-28|Author=NatashaBaucas
at
http://www.flickr.com/photos/sdnatasha/|Permission=Creative Commons
Attribution|other_versions=}}{{Location dec|32.705573|-117.160391|}}==
{{int:license}} =={{self|cc-by-2.0|author=Natasha
Baucas}}{{PermissionOTRS|ticket=
https://ticket.wikimedia.org/otrs/index.pl?Action=AgentTicketZoom&TicketID=3519937}}[[Category:MeganFox
in 2009]][[Category:Josh Brolin]][[Category:Michael
Fassbender]][[Category:2009 Comic-Con International]][[Category:Images
uploaded by User:Nehrams2020]

我可以使用 Wikipedia API 来获取未截断的评论吗?

4

1 回答 1

3

您得到的注释iiprop=comment是“文件历史”表中显示的一小段文本,它们被截断为 255 个字节的原因是因为它们一开始就是这样存储在数据库中的。

相反,您想要的是文件描述页面的内容,您获得的方式与获得任何页面内容的方式相同:rvprop=content.

(之所以会如此混乱是因为默认的MediaWiki上传界面有点奇怪。图片评论实际上是类似于编辑摘要的简短注释,但是当您第一次上传新图片时,您输入的相同文本是用于页面内容图像评论。如果太长而无法放入评论中——就像现在维基百科上常见的那样——评论会被默默地截断,但全文仍然会进入页面内容。我猜有人在第一次编写该界面时认为这是有道理的;当时图像描述往往要短得多。)

于 2011-10-30T00:48:13.483 回答