当我尝试使用大小> = 1MB 的输入Json 文件的Crawler 检测文件类型时,它会在粘合中创建一个表,其分类类型为“未知”。但是当大小小于 1MB 时,它成功地将文件类型分类为 JSON。
我交叉检查了文件以确保它是有效的 json 文件。
这是 aws 爬虫的限制。
如果是这样,这个问题是否有任何替代方案。
当我尝试使用大小> = 1MB 的输入Json 文件的Crawler 检测文件类型时,它会在粘合中创建一个表,其分类类型为“未知”。但是当大小小于 1MB 时,它成功地将文件类型分类为 JSON。
我交叉检查了文件以确保它是有效的 json 文件。
这是 aws 爬虫的限制。
如果是这样,这个问题是否有任何替代方案。