5

我已经实现了一个 python 模块,它使用 python scrapy 抓取两个 torrent 站点。它目前将 torrent 数据存储在数据库中,并且可以通过调用下载 .torrent 文件的 bash 脚本来下载 torrent 文件。

出于数据库可视化研究的目的,我想知道是否有可能,如果有,如何获取特定 torrent 文件的 IPseeders地址peers。我想创建一个可视化来查看 torrent 文件、它们的类型(电影、iso 图像、书籍等)与它们的种子位置/对等点正在下载的位置之间的相关性。

例如,这是我抓取的一个 .torrent 文件中的内容:(只是其中的一部分)

d8:announce38:udp://tracker.publicbt.com:80/announce13:announce-listll38:udp://tracker.publicbt.com:80/announceel44:udp://tracker.openbittorrent.com:80/announceel35:udp://tracker.istole.it:80/announceel36:udp://open.demonii.com:1337/announceee7:comment61:Torrent downloaded from torrent cache at http://torcache.net/10:created by15:BitTorrent/782013:creation datei1384198882e8:encoding5:UTF-84:infod5:filesld6:lengthi25485e4:pathl69:Physics of Quantum Mechanics, The - Skinner, David, Binney, James.jpgeed6:lengthi1254e4:pathl69:Physics of Quantum Mechanics, The - Skinner, David, Binney, James.opfeed6:lengthi4609366e4:pathl69:Physics of Quantum Mechanics, The - Skinner, David, Binney, James.pdfeee4:name52:The Physics of Quantum Mechanics- Oxford, 2013 [PDF]12:piece lengthi16384e6:pieces5660:³é^G^W^H<83>æZèÖunB2ä<82>ªb­<96>".ËWvÓo^?.F´<8e>ÍZQQÕ¬8Þ+þXS<91>-S^O9<91>¸<9f>Ê'<97>3ÎpÕöC^CNÞÔ»^F3HJ,=Àòà¶,<81><ö<84><8a>ÃÀdÔ,^SýZ<8f>!Q"r¹<98>³Agì=ûr"ged<96>½<89>à ¥E'Å^V|ïª{^M<88><9c>»z½/qsø<^8^@í¤Ô[_<83><9e><97>Éãs^V×»Ö\Ûë"^NÝó<9e>¬^Kbì«õ<98>²<82>^\_PÍFª^_µ^L<9b>^Vâ^NhÛ<87>-@ê\íäÎ/³<8c>^]jÀóp<87>¬ <87><8e>,?<8d>&^^®Rê±ÃFÏÂ&Ü]!ö<87><zü{SîÖg.I±Ã^QÃ~Ê>uÛÜä^Cw^_d_r0<8a>h<81><9b>êªE­Ça^N¢M4Èv^_<96>lË,g­^Fò«^]¿<9c><88>p^[Ñ.ìk©t

我能否使用文件中的此信息连接到跟踪器并继续查找该文件的对等点和播种器?

4

1 回答 1

3

基本上是的,因为这是 BitTorrent 客户端所做的。看看Bittorrent 规范。文件格式的详细信息以及协议规范都在那里。这应该告诉你你需要知道的一切。

于 2013-11-11T23:39:14.230 回答