MySQL中JSON的存储原理(mysql中json字段操作)
liuian 2025-07-06 14:06 48 浏览
前言:表中有json字段后,非索引查询性能变得非常糟糕
起因是我有一张表,里面有json字段后,而当mysql表中有200w数据的时候,走非索引查询性能变得非常糟糕需要3到5s。因此对mysql的json类型做了梳理
先说建表建议
对于大宽主表的建表的建议是,拆成2个表,把需要用来查询的字段放到主表,其他的字段全部放在扩展表。varchar类型的字段,长度尽可能短
一、JSON在硬盘中的存储原理
MySQL采用二进制格式存储的 JSON 值,在磁盘存的是doc对象,内含type & value。
doc ::= type value
type ::=
0x00 | // small JSON object
0x01 | // large JSON object
0x02 | // small JSON array
0x03 | // large JSON array
0x04 | // literal (true/false/null)
0x05 | // int16
0x06 | // uint16
0x07 | // int32
0x08 | // uint32
0x09 | // int64
0x0a | // uint64
0x0b | // double
0x0c | // utf8mb4 string
0x0f // custom data (any MySQL data type)
value ::=
object |
array |
literal |
number |
string |
custom-data- MySQL对JSON对象存储是分段的,存储的最前面为存放当前对象的元素个数,以及整体占的大小
- type主要是标识类型(大json对象、小json对象、大json数组、小json数组、literal、int16、uint16、int32、uint32、int64、uint64、double、string、custom自定义类型);
- value包含object、array、literal、number、string、custom-data(与type类型对应);
- 当需要读取JSON值的时候,二进制格式的结构使服务器能够直接通过键或数组索引查找子对象或嵌套值,而无需读取文档中它们之前或之后的所有值。
- 当需要写JSON值的时候,从二进制形式转换到内存中的结构化DOM,并使用JSON值的递归树表示与解析树紧密对应;
二、JSON在内存中的占据空间原理
对于varchar(255) 类型的字段,硬盘上是按照真实空间存储,而加载到内存中后,内存中的长度是varchar定义的长度255存储
JSON在内存中占用的空间资料没查到,但是应该是根据实际空间占用,因为json中存了实际长度
三、JSON类型最大长度和溢出页的概念
JSON最大存储长度为4G,但是实际能存多少还取决于mysql设置的一次更新最大包的大小(默认1M),
思考下Innodb聚簇索引的特征, 会建立一个主键索引并把整行数据放到一起。那么如果有一个字段是JSON类型或者Text或者varchar(1000)这种长字段的存在,是否会应为一行数据太大,mysql一页16K会不会放不下?
即使放下了 走主键索引是否会太慢?
先说结论,
第一、mysql一页16K至少可以放了两条数据
第二、mysql有一个行溢出的概念, 5.7之后的默认行格式为dynamic,特点是对于VARCHAR(M)、Text、JSON类型的数据,只在聚簇索引行存放真实数据的地址。而真实的数据放到溢出页里面。这样就能保证16K一页能尽可能密集,进而提升索引查询效率
添加图片注释,不超过 140 字(可选)
看到这应该能理解为何用非索引查询很慢,原因是要跳转寻找真实数据
四、JSON索引
MySQL 5.7 针对JSON的索引做了优化,具体方式就是通过生成列来实现JSON某个字段的索引。通俗的来说就是针对JSON指定的列抽取出来,通过冗余该字段的方式来实现索引
目前支持两种生成列形式,即Virtual Generated Column(虚拟生成列)和Stored Generated Column(存储生成列),支持在生成列上定义二级索引(不能与普通列定义联合索引),仅支持本表的非生成列上定义生成列。
- Virtual Generated Column不会将这一生成列的数据持久化到磁盘上(仅将虚拟列的元数据信息存在于相关系统表中),不支持针对虚拟列进行Update & Insert 的操作。在对应普通列Insert和Update操作时会消耗额外的写负载,因为更新虚拟生成列索引时需要将衍生列值计算出来,并写到索引里;这样就避免了每次读取数据行时都需要进行一次衍生计算。
- Stored Generated Column 会将数据持久化到磁盘上,在存储生成列上定义索引其实和普通列上定义索引无区别,性能上也不如虚拟索引,会导致聚簇索引变得更大更占空间。
-- 定义虚拟生成列
ALTER TABLE `user` ADD COLUMN `v_sign_time` BIGINT ( 20 )
GENERATED ALWAYS AS ( attachment -> '$.sign_time' ) Virtual NULL AFTER attachment;
-- 定义索引
ALTER TABLE `user` ADD INDEX `idx_sign_time` (`v_sign_time`);相关推荐
-
- 电脑无法从u盘启动怎么办(电脑无法从u盘启动解决方法)
-
电脑的进入不了u盘启动的解决方法:一、我们第一步需要确定的是你的u盘在别的电脑上检查一下U盘是否可读,如果可读的话是否成功制作了u盘启动盘了,因为想要启动进入pe的话需要u盘具备启动的功能。 二、如果你检查好自己的u盘已经成功制作了启动盘...
-
2026-01-13 10:05 liuian
- cpu频率越高越好吗(cpu频率越高速度越快吗)
-
高好。CPU的频率是影响CPU的一个重要因素,直观上来说,频率的高低影响了CPU的性能。频率越高,CPU性能越好;不过需要注意的是,CPU的主频表示在CPU内数字脉冲信号震荡的速度,与CPU实际的运算...
- 注册表清理软件(注册表清理软件残留软件)
-
你好!关于注册表清理工具的推荐,以下是几个值得推荐的工具:1.CCleaner:这是一款功能强大的免费清理工具,可以有效地清理注册表、垃圾文件等,使用简单方便。2.WiseRegistryCl...
- 显卡驱动升级有好处吗(显卡驱动升级有什么坏处)
-
显卡的新版本驱动能修改一些游戏,图形显示的BUG,所以新版本的显卡驱动能有效的利用显卡的资源,提高游戏性能。不仅可以修正旧版本中的BUG,而且可以进一步挖掘显卡硬件的功能,使得部分硬件功能得以充分发挥...
- w7旗舰版系统安装无线网卡(win7系统安装无线网卡)
-
要在Windows7中安装无线网卡,请按照以下步骤进行操作:1.检查您的计算机是否已安装无线网卡。您可以通过右键单击“我的电脑”并选择“属性”来查看计算机的硬件设置。如果计算机没有内置无线网卡,则...
- 腾达路由器管理员密码是什么
-
1、旧版本的腾达路由器,默认的用户名和密码都是:admin。?旧版腾达路由器的初始密码是:admin2、目前腾达新推出的无线路由器,在出厂状态下,是没有初始管理员密码的。?新版腾达路由器没有初始密码新...
- 电脑开机只有一个鼠标箭头黑屏
-
解决方法如下:1、同时按“ctrl+shlft+exc”键,调出任务管理器。2、点击任务管理器左下角的“详细信息”。3、然后点击左上角“文件”里的“运行新任务”。4、弹出新窗口,输入“explorer...
- 把vx好友删了想找回聊天记录
-
没有啦,联系人列表里没有了,聊天记录就没有了,无法进行恢复,收不到好友消息微信删除好友时会同时删除与该联系人的聊天记录,不过对方还是有双方的微信聊天记录的,删除好友后将无法发送消息给对方,所以伙伴们在...
- 163邮箱密码正确就是登不上(163邮箱密码一直错误)
-
邮箱不能登录或登录异常的原因有很多种哦,如您浏览器“隐私”或“安全”级别设置过高,或用户名、密码输入不正确、较长时间未登录被冻结等都会导致不能登录或登录异常。请您先检查一下哦。解决无法登录的方法有:...
- 移动硬盘维修费用大概是多少钱
-
芯片不需要多少钱,但数据恢复就另当别论了。。。如果认识人就帮你换个芯片板,要不了多少钱,如果是硬盘盒的芯片板坏了你就乾脆换个盒子,80左右。如果是硬盘芯片坏了,那就不好办了,没人愿意给你换阿。。。但如...
- windows资源管理器停止工作是什么原因
-
1.在进行重装系统之前,可以先检测一下windows资源管理器停止工作的原因是什么。如果是因为电脑的文件太多了,垃圾堆积导致的停止工作,我们就不需要进行重装系统。我们只需要下载一个360卫士或者其他可...
- 联想电脑24小时维修热线电话
-
1.打开Think.lenovo.com.cn网页,点击登陆。 2.输入用户名密码,点击登陆。 3.点击右上角的:返回个性化首页。 4.点击“咨询与报修”中的“网上报修”。 ...
- u盘上的系统怎么安装到电脑上
-
如果这个u盘是已经制作成为启动盘,可以进入pe系统的话就可以从u盘启动进入到pe系统中进行系统安装!如果你的意思是u盘里直接是操作系统的话,那就在bios设置里直接设定为u盘启动就好了!也可以在pe中...
- 20年前老笔记本改造升级(比较老的笔记本电脑改装)
-
答:10年前的笔记本电脑升级改造的方法。1.减少电脑后台程序。电脑和手机也是差不多的,有些软件在关闭之后并没有真正的退出,而是在后台偷偷的运行,这样也是占电脑内存,这样会导致电脑变得越来有。2....
- 住房公积金贷款计算器(住房公积金贷款计算器在线)
-
房贷、公积金贷款计算器基本养老保险金计算器基本医疗保险金计算器工伤保险计算器住房公积金缴存计算器养老保险退休金计算器五险一金及税后工资计算器失业保险计算器住房公积金贷款利息怎么计算,具体如下:公积金贷...
- 一周热门
-
-
飞牛OS入门安装遇到问题,如何解决?
-
如何在 iPhone 和 Android 上恢复已删除的抖音消息
-
Boost高性能并发无锁队列指南:boost::lockfree::queue
-
大模型手册: 保姆级用CherryStudio知识库
-
用什么工具在Win中查看8G大的log文件?
-
如何在 Windows 10 或 11 上通过命令行安装 Node.js 和 NPM
-
威联通NAS安装阿里云盘WebDAV服务并添加到Infuse
-
Trae IDE 如何与 GitHub 无缝对接?
-
idea插件之maven search(工欲善其事,必先利其器)
-
如何修改图片拍摄日期?快速修改图片拍摄日期的6种方法
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
