我正在构建一个网站,用于抓取The List,这是旧金山湾区即将举行的音乐会的集合,以便为在现代 Web GUI 中提供列表服务的应用程序提供动力。
现在,我有一个网络工作者,它向磁盘写入一个声明,该声明为抓取过程的每个阶段都有一个文件夹:抓取原始 HTML,抓取 HTML,并将抓取的结果转换为结构化的东西。最终文件是一个 JSON 文件,其中包含一堆对象,如下所示:
{
"band": "Willie Nelson And Family",
"date": "2018-10-17T00:00:00-07:00",
"numberOfShows": "1 show",
"venue": "Graton Resort, 288 Golf course Dr., Rohnert Park",
"time": "8pm",
"soldOut": false,
"pit": false,
"multiDay": false,
"ages": "21+",
"price": "$250"
}
我想定期将此文件导入graphcool,我计划在其中拥有三个实体:
- 艺术家,这只是乐队的名字
- 场地,这是场地的名称,也可能是地址
- 一场表演,即在给定日期和时间在给定地点的一位或多位艺术家
我的问题是双重的:
- 我如何重组这个 JSON 文件,以便以 graphcool 喜欢的方式构建它?
和
- 如何定期将此文件的内容上传到graphcool?