我想抓取 medium.com 网站上的所有帖子。
问题是medium.com 网站上的所有帖子都无法提供信息。
也经常有网站网址发生变化的媒体网站。我不知道如何解决这个问题。
我英语不好,所以我把翻译转过来。对不起。
我访问了 medium developer page 并查看了 api 代码。
但我不知道如何在我想带的所有板上获取所有信息。
是否提供所有用户信息或所有公告板信息?
最后,如果上述信息可用,croller 将能够找到他或她想要的信息。
我想抓取 medium.com 网站上的所有帖子。
问题是medium.com 网站上的所有帖子都无法提供信息。
也经常有网站网址发生变化的媒体网站。我不知道如何解决这个问题。
我英语不好,所以我把翻译转过来。对不起。
我访问了 medium developer page 并查看了 api 代码。
但我不知道如何在我想带的所有板上获取所有信息。
是否提供所有用户信息或所有公告板信息?
最后,如果上述信息可用,croller 将能够找到他或她想要的信息。
看起来他们的 API 不允许您查看除了您登录的任何帐户已订阅或有权写入/编辑之外的任何内容。我认为这是您遇到的问题:
“返回与用户以某种方式相关的出版物的完整列表:这包括用户订阅、写入或编辑的所有出版物。此端点提供了一组类似于您将在https 中看到的数据: //medium.com/me/publications登录后。”
不幸的是,该媒体并未提供所有帖子的详细信息。Medium 仅提供最后 10 个帖子的RSS 提要,您需要将它们转换为 JSON 对象。使用以下链接并替换您的用户名而不是@userName。在 Medium API 中,您可以获取发布的帖子,但无法获取用户的帖子。阅读文档。
https://api.rss2json.com/v1/api.json?rss_url=https://medium.com/feed/@userName