0

我几乎完成了 avro 部分,但我面临着一个巨大的挑战,那就是名称和命名空间。我已经尝试过了,无论我做了什么,我都遇到了错误,即使在引用以下文档时也是如此:docs.oracle.com/cd/E26161_02/html/GettingStartedGuide/avroschemas.html

我的架构标题是: https ://i.ibb.co/TPH8shF/image.png

错误是: https ://i.ibb.co/BCcX6Jd/image.png

但是,当我将架构添加到命名空间时(因为它位于架构文件夹中),出现此错误: https ://i.ibb.co/Z62RwN2/image.png

你们中有人知道可能导致此错误的原因吗?谢谢!

这是文本版本,如果您需要它:

src_data_path = 'data/processed/openflights/routes.jsonl.gz'
parsed_schema = load_schema("routes.avsc")
avro_output_path = results_dir.joinpath('results/routes.avro')
src_data_path = 'routes.jsonl'
with open(src_data_path, 'r') as f:
    avro_reader = json_reader(f, parsed_schema)        
    for record in avro_reader:
        print(record)
{
  "type": "record",
  "name": "routes",
  "namespace": "schemas",
  "fields": [
    {
      "name": "airline",
      "type": {
        "type": "record",
        "name": "Airline",
        "fields": [
          {
            "name": "airline_id",
            "type": "int",
            "default": -1
          },
          {
            "name": "name",
            "type": "string",
            "default": "NONE"
          },
          {
            "name": "alias",
            "type": "string",
            "default": "NONE"
          },
          {
            "name": "iata",
            "type": "string",
            "default": "NONE"
          },
          {
            "name": "icao",
            "type": "string",
            "default": "NONE"
          },
          {
            "name": "callsign",
            "type": "string",
            "default": "NONE"
          },
          {
            "name": "country",
            "type": "string",
            "default": "NONE"
          },
          {
            "name": "active",
            "type": "boolean",
            "default": false
          }
        ]
      },
      "default": "NONE"
    },
    {
      "name": "src_airport",
      "type": [
        {
          "type": "record",
          "name": "Airport",
          "fields": [
            {
              "name": "airport_id",
              "type": "int",
              "default": -1
            },
            {
              "name": "name",
              "type": "string",
              "default": "NONE"
            },
            {
              "name": "city",
              "type": "string",
              "default": "NONE"
            },
            {
              "name": "iata",
              "type": "string",
              "default": "NONE"
            },
            {
              "name": "icao",
              "type": "string",
              "default": "NONE"
            },
            {
              "name": "latitude",
              "type": "double"
            },
            {
              "name": "longitude",
              "type": "double"
            },
            {
              "name": "timezone",
              "type": "double"
            },
            {
              "name": "dst",
              "type": "string",
              "default": "NONE"
            },
            {
              "name": "tz_id",
              "type": "string",
              "default": "NONE"
            },
            {
              "name": "type",
              "type": "string",
              "default": "NONE"
            },
            {
              "name": "source",
              "type": "string",
              "default": "NONE"
            }
          ]
        },
        "null"
      ],
      "default": "NONE"
    },
    {
      "name": "dst_airport",
      "type": [
        "record",
        "null"
      ],
      "fields": [
      {
       "name": "source",
       "type": "string",
       "default": "NONE"
      }
      ],
      "default": "NONE"
    },
    {
      "name": "codeshare",
      "type": "boolean",
      "default": false
    },
    {
      "name": "stops",
      "type": "int",
      "default": 0
    },
    {
      "name": "equipment",
      "type": {
        "type": "array",
        "items": "string"
      }
    }
  ]
}
4

1 回答 1

0

在您的定义中dst_airport具有以下内容:

    {
      "name": "dst_airport",
      "type": [
        "record",
        "null"
      ],
      "fields": [
      {
       "name": "source",
       "type": "string",
       "default": "NONE"
      }
      ],
      "default": "NONE"
    },

typeof["record", "null"]没有意义,因为您还没有定义一个名为“记录”的命名类型(而且我不确定规范是否允许您这样做。无论哪种方式,我假设它应该是["Airport", "null"].

另外,fields这里真的没有意义。它不能是带有fields.

于 2022-01-16T21:08:19.450 回答