mysql - 从 MySQL 读取时从 JSON 数组的每个 JSON 对象中过滤掉不需要的字段

Question

假设我的 MySQL 数据库中有一个表，其中包含 JSON 类型的列之一，并且我已将以下 JSON 保存在其中一个记录中

{
  "about": "person",
  "info": [
    {
      "fName": "John",
      "lName": "Booker",
      "sex": "male",
      "age": 20
    },
    {
      "fName": "Laurie",
      "lName": "Sparks",
      "sex": "female"
    },
    {
      "fName": "Adam",
      "lName": "Bate",
      "age": 26
    }
  ]
}

有什么方法可以提取以下内容吗？

[
  {
    "sex": "male",
    "age": 20
  },
  {
    "sex": "female"
  },
  {
    "age": 26
  }
]

$.info[*]给我这个

[
  {
    "fName": "John",
    "lName": "Booker",
    "sex": "male",
    "age": 20
  },
  {
    "fName": "Laurie",
    "lName": "Sparks",
    "sex": "female"
  },
  {
    "fName": "Adam",
    "lName": "Bate",
    "age": 26
  }
]

并$.info[*].sex分别$.info[*].age给我这些

["male", "female"]

[20, 26]

我想我也可以通过以下方式工作，但我不知道如何

["male", "female", null]

[20, null, 26]

原始问题上下文

我目前使用的应用程序在 MySQL 数据库中保存了一些 JSON 内容。此 JSON 可能具有某些字段，其值是巨大的 Base64 编码图像。有时我的客户并不关心获取这些 Base64 编码的图像。因此，为了提高性能，减少从数据库传输到我的应用程序的数据并避免在应用程序端进行处理，我想检索不涉及存储这些巨大图像的 JSON 数组的每个 JSON 对象元素中的所有字段信息。

我当前的实现是从数据库中获取整个 JSON 对象，然后使用 JSON Schema（受此项目启发）获取必要的字段，但其性能不符合预期的 SLA。我真的很想在 MySQL 服务器上进行尽可能多的数据处理，然后再将其放入我的应用程序并在需要时进一步处理它。

PS：我明白了；不像 AWS S3 之类的东西；数据库可能不是存储大型 JSON 文档的最佳选择。但我想利用其他 NoSQL 数据存储可能无法使用的数据库的批量读取功能

score 2 · Accepted Answer

更新

从 MySQL 8.0 开始，您可以更轻松地执行此操作，以从每个对象JSON_TABLE中提取sex和值：age

SELECT JSON_ARRAYAGG(JSON_OBJECT('sex', j.sex, 'age', j.age)) AS filtered
FROM test t
JOIN JSON_TABLE(t.j, 
                '$.info[*]'
                COLUMNS (
                  sex VARCHAR(6) PATH '$.sex',
                  age INT PATH '$.age'
                )
                ) j

假设有一列j包含您的原始数据，这给出：

[
  {"age": 20, "sex": "male"},
  {"age": null, "sex": "female"},
  {"age": 26, "sex": null}
]

如果要避免这些null值，可以使用CASE表达式来检查它们并更改基于该值创建的对象：

SELECT JSON_ARRAYAGG(
         CASE WHEN j.sex IS NULL THEN JSON_OBJECT('age', j.age)
              WHEN j.age IS NULL THEN JSON_OBJECT('sex', j.sex)
              ELSE JSON_OBJECT('sex', j.sex, 'age', j.age)
         END
         ) AS filtered
FROM test t
JOIN JSON_TABLE(t.j, 
                '$.info[*]'
                COLUMNS (
                  sex VARCHAR(6) PATH '$.sex',
                  age INT PATH '$.age'
                )
                ) j
WHERE j.sex IS NOT NULL OR j.age IS NOT NULL

输出：

[
  {"age": 20, "sex": "male"},
  {"sex": "female"},
  {"age": 26}
]

dbfiddle 上的演示（两个查询）

原始答案

不幸的是，我认为这不能直接使用内置的 MySQL JSON 函数来完成（如果JSON_REMOVE可以接受通配符路径）。然而，它可以通过这样的存储函数来实现：

CREATE FUNCTION filter_json(j JSON) RETURNS JSON
BEGIN
  DECLARE n INT DEFAULT 0;
  DECLARE info, sex, age, data JSON;

  SET info = JSON_ARRAY();
  WHILE JSON_CONTAINS_PATH(j, 'one', CONCAT('$.info[', n, ']')) DO
    SET data = JSON_OBJECT();
    SET sex = JSON_EXTRACT(j, CONCAT('$.info[', n, '].sex'));
    IF sex IS NOT NULL THEN
       SET data = JSON_INSERT(data, '$.sex', sex);
    END IF;
    SET age = JSON_EXTRACT(j, CONCAT('$.info[', n, '].age'));
    IF age IS NOT NULL THEN
       SET data = JSON_INSERT(data, '$.age', age);
    END IF;
    SET info  = JSON_ARRAY_APPEND(info, '$', data);
    SET n = n + 1;
  END WHILE;
  RETURN info;
END;

请注意，根据您的环境，您可能需要DELIMITER //在输入函数之前更改分隔符（例如使用）。

对于此查询：

SELECT filter_json('{ "about": "person", "info": [ { "fName": "John", "lName": "Booker", "sex": "male", "age": 20 }, { "fName": "Laurie", "lName": "Sparks", "sex": "female" }, { "fName": "Adam", "lName": "Bate", "age": 26 } ] }')

你会得到你想要的输出：

[
  {"age": 20, "sex": "male"},
  {"sex": "female"}, 
  {"age": 26}
]

dbfiddle 上的演示

mysql - 从 MySQL 读取时从 JSON 数组的每个 JSON 对象中过滤掉不需要的字段

1 回答 1

Related

Reference