我有一个 json 文件存储一些用户信息,包括id
,name
和url
. json 文件如下所示:
{"link": "https://www.example.com/user1", "id": 1, "name": "user1"}
{"link": "https://www.example.com/user1", "id": 2, "name": "user2"}
这个文件是由一个scrapy spider编写的。现在我想从 json 文件中读取 url 并抓取每个用户的网页。但我无法从 json 文件中加载数据。
目前,我不知道如何获取这些 url。我想我应该先从 json 文件中读取这些行。我在 Python shell 中尝试了以下代码:
import json
f = open('links.jl')
line = json.load(f)
我收到以下错误消息:
Raise ValueError(errmsg("Extra data", s, end, len(s)))
ValueError: Extra data: line 2 column 1- line 138 column 497(char498-67908)
我在网上做了一些搜索。搜索表明 json 文件可能存在一些格式问题。但是json文件是使用scrapy管道创建并填充项目的。有人知道导致错误的原因吗?以及如何解决?关于阅读网址有什么建议吗?
非常感谢。