百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

如何在 MySQL 中使用 JSON 数据(mysql的json函数与实例)

liuian 2025-07-06 14:06 41 浏览

在 MySQL 中学习“NoSQL”

MySQL 从5.7版本开始就支持JSON格式的数据类型,该数据类型支持 JSON 文档的自动验证和优化存储和访问。尽管 JSON 数据最好存储在MongoDB等 NoSQL 数据库中,但您仍然可能会不时遇到包含 JSON 数据的表。在本文的第一节中,我们将介绍如何使用简单的语句从 MySQL 中的 JSON 字段中提取数据。在第二部分中,我们将介绍如何将 MySQL 表中的数据聚合成 JSON 数组或对象,然后可以方便地在您的应用程序中使用。

所要搭建的系统与上一篇关于如何在Python中执行SQL查询的文章中介绍的系统类似。如果您已按照该文章中的说明设置了系统,则可以继续下一节。如果没有,您可以按照下面的简化说明来设置您的系统。有关命令和选项的详细解释,请参考上一篇文章。

本质上,我们将在 Docker 容器中启动本地 MySQL 服务器:

# Create a volume to persist the data.
$ docker volume create mysql8-data

# Create the container for MySQL.
$ docker run --name mysql8 -d -e MYSQL_ROOT_PASSWORD=root -p 13306:3306 -v mysql8-data:/var/lib/mysql mysql:8

# Connect to the local MySQL server in Docker.
$ docker exec -it mysql8 mysql -u root -proot
mysql> SELECT VERSION();
+-----------+
| VERSION() |
+-----------+
| 8.0.27    |
+-----------+
1 row in set (0.00 sec)

您可以直接在上面启动的控制台中执行 SQL 查询。或者,如果您更喜欢使用图形界面,则可以安装和使用DBeaver,它是适用于所有类型数据库的出色图形数据库管理器。如果您一直在为 MySQL Workbench 苦苦挣扎,那么它真的值得一试。有关如何安装和设置 DBeaver 的更多详细信息,本文有一个简短但有用的摘要。

让我们首先探讨可用于从 JSON 字段中提取数据的常见 MySQL 函数和运算符。

MySQL 中有两种主要类型的JSON 值:

  • JSON 数组 — 以逗号分隔并括在方括号 ([]) 中的值列表。
  • JSON 对象 — 字典/哈希图/对象(名称在不同的编程语言中不同),具有一组以逗号分隔并括在大括号 ({}) 中的键值对。

JSON 数组和对象可以相互嵌套,我们将在后面看到。

我们可以使用该JSON_EXTRACT函数从 JSON 字段中提取数据。基本语法是:

JSON_EXTRACT(json_doc, 路径)

对于 JSON 数组,路径由 指定$[index],其中索引从 0 开始:

mysql>选择 JSON_EXTRACT('[10, 20, 30, 40]', '$[0]') ; 
+----------------------------------------+ 
| JSON_EXTRACT('[10, 20, 30, 40]', '$[0]') | 
+----------------------------------------+ 
| 10 | 
+----------------------------------------+


对于 JSON 对象,路径由 指定$.key,其中key是对象的键。

mysql> SELECT JSON_EXTRACT('{"name": "John", "age": 30}', '$.name') ; 
+------------------------------------------------ ------+ 
| JSON_EXTRACT('{"name": "John", "age": 30}', '$.name') | 
+------------------------------------------------ ------+ 
| “约翰” | 
+------------------------------------------------ ------+

JSON_EXTRACT如果上面使用的只有两个参数,我们可以使用->作为别名的运算符JSON_EXTRACT。为了演示此运算符的用法,我们需要一个包含 JSON 字段的表。请复制以下 SQL 查询并在 MySQL 控制台或 DBeaver 中执行它们:

CREATE DATABASE IF NOT EXISTS `data`
;

CREATE TABLE `data`.`student_logs` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(50) NOT NULL,
  `log` json DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `ix_name` (name)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin
;

INSERT INTO `data`.student_logs 
    (id, name, `log`)
VALUES
    (1, 'Juan', '{"test_name": "IELTS", "test_id": "T1", "scores": [7.5, 8.0, 8.0, 9.0]}'),
    (2, 'Lee', '{"test_name": "IELTS", "test_id": "T2", "scores": [8.5, 7.5, 7.0, 8.0]}'),
    (3, 'Kim', '{"test_name": "IELTS", "test_id": "T3", "scores": [7, 8.5, 8.0, 8.0]}'),
    (4, 'Hans', '{"test_name": "IELTS", "test_id": "T4", "scores": [6.5, 8.0, 7.5, 9.0]}')
;

特别是,MySQL 使用utf8mb4字符集和utf8mb4_bin排序规则处理 JSON 上下文中使用的字符串。字符集是一组符号和编码,排序规则是一组用于比较字符集中字符的规则。最好使用相应的字符集和排序规则创建带有 JSON 字段的表。

因为utf8mb4_bin是二进制排序规则,键是区分大小写的,我们需要用正确的大小写来指定它们:

SELECT
    JSON_EXTRACT(`log`, '$.test_name') AS test_name,   -- Correct case, can be extracted.
    JSON_EXTRACT(`log`, '$.TEST_NAME') AS TEST_NAME    -- Incorrect case, cannot be extracted.
FROM `data`.`student_logs`
;

test_name|TEST_NAME|
---------+---------+
"IELTS"  |         |
"IELTS"  |         |
"IELTS"  |         |
"IELTS"  |         |

现在我们可以使用->运算符从 JSON 字段中提取数据:

SELECT
    id AS student_id,
    name,
    JSON_EXTRACT(`log`, '$.test_name') AS test_name,
    `log` -> '$.test_id' AS test_id,
    `log` -> '$.scores' AS scores
FROM `data`.`student_logs`
;

student_id|name|test_name|test_id|scores              |
----------+----+---------+-------+--------------------+
         1|Juan|"IELTS"  |"T1"   |[7.5, 8.0, 8.0, 9.0]|
         2| Lee|"IELTS"  |"T2"   |[8.5, 7.5, 7.0, 8.0]|
         3| Kim|"IELTS"  |"T3"   |[7, 8.5, 8.0, 8.0]  |
         4|Hans|"IELTS"  |"T4"   |[6.5, 8.0, 7.5, 9.0]|

如我们所见,->只是 . 的快捷方式或别名JSON_EXTRACT

test_name有趣的是,对于and的引号仍然存在test_id。这不是我们想要的。我们希望删除引号,类似于该name字段。

要删除提取值的引号,我们需要使用该JSON_UNQUOTE函数。
由于JSON_UNQUOTE(JSON_EXTRACT(…))如此常用,因此此组合也有一个快捷运算符,即->>. 让我们在实践中看看它:

SELECT
    id AS student_id,
    name,
    JSON_UNQUOTE(JSON_EXTRACT(`log`, '$.test_name')) AS test_name,
    `log` ->> '$.test_id' AS test_id,
    `log` -> '$.scores' AS scores
FROM `data`.`student_logs`
;

student_id|name|test_name|test_id|scores              |
----------+----+---------+-------+--------------------+
         1|Juan|IELTS    |T1     |[7.5, 8.0, 8.0, 9.0]|
         2| Lee|IELTS    |T2     |[8.5, 7.5, 7.0, 8.0]|
         3| Kim|IELTS    |T3     |[7, 8.5, 8.0, 8.0]  |
         4|Hans|IELTS    |T4     |[6.5, 8.0, 7.5, 9.0]|

证明->>JSON_UNQUOTE(JSON_EXTRACT(...))具有相同的结果。由于->>输入的次数少得多,因此在大多数情况下是首选。

但是,如果要从嵌套的 JSON 数组或 JSON 对象中提取数据,则:
不能使用 chained->->>. 您只能将->and用于->>顶层,而需要用于JSON_EXTRACT嵌套层。让我们提取每个学生的分数:

SELECT
    id AS student_id,
    name,
    JSON_UNQUOTE(JSON_EXTRACT(`log`, '$.test_name')) AS test_name,
    `log` ->> '$.test_id' AS test_id,
    JSON_EXTRACT(`log` -> '$.scores', '$[0]') AS listening,
    JSON_EXTRACT(`log` -> '$.scores', '$[1]') AS reading,
    JSON_EXTRACT(`log` -> '$.scores', '$[2]') AS writting,
    JSON_EXTRACT(`log` -> '$.scores', '$[3]') AS speaking
FROM `data`.`student_logs`
;

student_id|name|test_name|test_id|listening|reading|writting|speaking|
----------+----+---------+-------+---------+-------+--------+--------+
         1|Juan|IELTS    |T1     |7.5      |8.0    |8.0     |9.0     |
         2| Lee|IELTS    |T2     |8.5      |7.5    |7.0     |8.0     |
         3| Kim|IELTS    |T3     |7        |8.5    |8.0     |8.0     |
         4|Hans|IELTS    |T4     |6.5      |8.0    |7.5     |9.0     |

干杯! 它按预期工作。

从 MySQL 中的 JSON 字段中提取数据的关键要点:

  • 用于$.key从 JSON 对象中提取键的值。
  • 用于$[index]从 JSON 数组中提取元素的值。
  • 如果值不是字符串,则用作->快捷方式。JSON_EXTRACT
  • 如果值是一个字符串并且您想要删除提取的字符串的引号,则用作->>快捷方式。JSON_UNQUOTE(JSON_EXTRACT(...))
  • 如果要从嵌套的 JSON 数组或 JSON 对象中提取数据,则不能使用 chained->->>. 您只能将->and用于->>顶层,而需要用于JSON_EXTRACT嵌套层。

在 MySQL 中还有很多其他函数可以处理 JSON 数据。但是,如果您需要使用这些函数来验证/搜索您的 JSON 字段或对其执行 CRUD 操作,您应该认真考虑使用MongoDB来存储 JSON 字段。MongoDB在处理非结构化数据(文档)方面更加专业方便。

上面我们介绍了如何从MySQL中的JSON字段中提取值。现在我们将学习相反的知识,探索如何从 MySQL 表中选择 JSON 数据。要继续本节,我们需要一些虚拟数据。请复制以下 SQL 查询并在 MySQL 控制台或 DBeaver 中运行它们:

CREATE TABLE `data`.`ielts_scores` (
  `id` int(11) NOT NULL,
  `name` varchar(50) NOT NULL,
  `test_name` varchar(50) NOT NULL,
  `test_id` varchar(50) NOT NULL,
  `listening` decimal(2,1) NOT NULL,
  `reading` decimal(2,1) NOT NULL,
  `writting` decimal(2,1) NOT NULL,
  `speaking` decimal(2,1) NOT NULL,  
  PRIMARY KEY (`id`),
  UNIQUE KEY `uq_test_id` (test_id),
  KEY `ix_name` (name),
  KEY `ix_test_name` (test_name)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci
;

INSERT INTO `data`.`ielts_scores`
SELECT
    id AS student_id,
    name,
    `log` -> '$.test_name' AS test_name,
    `log` ->> '$.test_id' AS test_id,
    JSON_EXTRACT(`log` -> '$.scores', '$[0]') AS listening,
    JSON_EXTRACT(`log` -> '$.scores', '$[1]') AS reading,
    JSON_EXTRACT(`log` -> '$.scores', '$[2]') AS writting,
    JSON_EXTRACT(`log` -> '$.scores', '$[3]') AS speaking
FROM `data`.`student_logs`
;

对于此表,使用默认字符和排序规则。通过这两个查询,我们创建了一个表来存储从第一部分中提取的数据。这是数据管道和分析的常见任务,即在数据清洗后进行一些数据分析。实际上,您可能希望将分数存储在单独的表格中,以便表格更加规范化。但是,这里为了演示简单,将数据放在同一个表中。

我们现在可以使用以下函数将数据聚合到 JSON 数组中JSON_ARRARYAGG

SELECT
    JSON_ARRAYAGG(listening) AS listening_scores,
    JSON_ARRAYAGG(reading) AS reading_scores,
    JSON_ARRAYAGG(writting) AS writting_scores,
    JSON_ARRAYAGG(speaking) AS speaking_scores
FROM `data`.`ielts_scores`
;

listening_scores    |reading_scores      |writting_scores     |speaking_scores     |
--------------------+--------------------+--------------------+--------------------+
[7.5, 8.5, 7.0, 6.5]|[8.0, 7.5, 8.5, 8.0]|[8.0, 7.0, 8.0, 7.5]|[9.0, 8.0, 8.0, 9.0]|

我们还可以使用以下函数将数据聚合到 JSON 对象中JSON_OBJECTAGG

SELECT
    JSON_OBJECTAGG(name, ROUND((listening+reading+writting+speaking)/4, 1)) AS ielts_scores 
FROM `data`.`ielts_scores`
;

ielts_scores                                      |
--------------------------------------------------+
{"Kim": 7.9, "Lee": 7.8, "Hans": 7.8, "Juan": 8.1}|

然后可以在您的应用程序中直接使用聚合数据。JSON_ARRARYAGG并且JSON_OBJECTAGG可以节省您在应用程序中聚合数据的工作,有时会很方便。例如,您可以使用该json.loads()方法将 JSON 字符串转换为 Python 中的数组或字典。

如果您需要在 Python 中执行纯 SQL 查询JSON_ARRARYAGG,您可以使用本文JSON_OBJECTAGG中演示的 SQLAlchemy 包。

在本文中,我们介绍了如何在 MySQL 中使用 JSON 数据。在第一部分中,通过简单示例讨论了用于从 JSON 字段中提取数据的函数和运算符。在第二部分中,我们做了相反的操作,将规范化数据聚合到 JSON 数组或对象中,然后可以直接在您的程序中使用。通常我们应该避免在 MySQL 中存储非结构化数据(文档)。但是,如果无法避免,本文中的知识应该对您的工作有所帮助。

相关推荐

Python中的列表详解及示例_python列表讲解

艾瑞巴蒂干货来了,数据列表,骚话没有直接来吧列表(List)是Python中最基本、最常用的数据结构之一,它是一个有序的可变集合,可以包含任意类型的元素。列表的基本特性有序集合:元素按插入顺序存储可变...

PowerShell一次性替换多个文件的名称

告别繁琐的文件重命名,使用PowerShell语言批量修改文件夹中的文件名,让您轻松完成重命名任务在日常工作中,我们经常需要对大量文件进行重命名,以便更好地管理和组织。之前,我们曾介绍过使用Pytho...

小白必看!Python 六大数据类型增删改查秘籍,附超详细代码解析

在Python中,数据类型可分为可变类型(如列表、字典、集合)和不可变类型(如字符串、元组、数值)。下面针对不同数据类型详细讲解其增删改查操作,并给出代码示例、输出结果及分析总结。1.列表(Li...

python数据容器之列表、元组、字符串

数据容器分为5类,分别是:列表(list)、元组(tuple)、字符串(str)、集合(set)、字典(dict)list#字面量[元素1,元素2,元素3,……]#定义变量变量名称=[元素1,元素...

python列表(List)必会的13个核心技巧(附实用方法)

列表(List)是Python入门的关键步骤,因为它是编程中最常用的数据结构之一。以下是高效掌握列表的核心技巧和实用方法:一、理解列表的本质可变有序集合:可随时修改内容,保持元素顺序混合类型:一个列表...

如何利用python批量修改文件名_python如何对文件进行批量命名

很多语言都可以做到批量修改文件名,今天我就给大家接受一下Python的方法,首选上需求。图片中有10个txt文件,现在我需要在这些文件名的前面全部加一个“学生”,可以吗?见证奇迹的时刻到了。我是怎么做...

Python中使用re模块实现正则表达式的替换字符串操作

#编程语言#我是"学海无涯自学不惜!",关注我,一同学习简单易懂的Python编程。0基础学python(83)Python中,导入re模块后还可以进行字符串的替换操作,就是sub()...

python列表十大常见问题,你遇到第几个?

Python列表常见问题及解决方案1.修改列表时的常见陷阱问题:在遍历时修改列表#错误做法:在遍历时删除元素会导致意外结果numbers=[1,2,3,4,5,6]forn...

python入门007:编辑列表_python列表怎么写入文件

一、列表的编辑操作列表创建后,随着程序的运行,可以通过对列表元素的增删改操作来编辑列表。1、修改列表元素的值修改列表元素的操作方法与访问列表元素的方法类似。例如,要修改列表元素的值,先指定列表及元素...

Python教程:在python中修改元组详解

欢迎你来到站长在线的站长学堂学习Python知识,本文学习的是《在Python中修改元组详解》。本知识点主要内容有:在Python中直接使用赋值运算符“=”给元组重新赋值、在Python中使用加赋值运...

Python列表(List)一文全掌握:核心知识点+20实战练习题

Python列表(List)知识点教程一、列表的定义与特性定义:列表是可变的有序集合,用方括号[]定义,元素用逗号分隔。list1=[1,"apple",3.14]lis...

Python教程-列表复制_python对列表进行复制

作为软件开发者,我们总是努力编写干净、简洁、高效的代码。Python列表是一种多功能的数据结构,它允许你存储一个项目的集合。在Python中,列表是可变的,这意味着你可以在创建一个列表后改变它的...

Python入门学习教程:第 6 章 列表

6.1什么是列表?在Python中,列表(List)是一种用于存储多个元素的有序集合,它是最常用的数据结构之一。列表中的元素可以是不同的数据类型,如整数、字符串、浮点数,甚至可以是另一个列表。列...

Python列表、元组、字典和集合_python中的列表元组和字典

Python中的列表(List)、元组(Tuple)、字典(Dict)和集合(Set)是四种最常用的核心数据结构。掌握它们的基础操作只是第一步,真正发挥威力的是那些高级用法和技巧。首先我们先看一下这...

学习编程第167天 python编程 使用format方法灵活替换字符串

今天学习的是刘金玉老师零基础Python教程第51期,主要内容是python编程使用format方法灵活替换字符串。一、format方法(一)format方法是字符串自带的方法,使用的format方法...