百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

MySQL Json有哪些缺点 mysql json类型对应java什么类型

liuian 2024-12-26 15:05 31 浏览

讨伐 json

今天的分享是再批 json, 去年分享过因为 mysql json 导致的故障,今天的 case 其实是去年的姊妹篇,原理一模一样。有两个原因不建议用 json:

  • Table Schema 就是强一致的,约束开发不要乱搞,json 这种弱约束的就是开后门,时间一长 json 字段就成了下水道
  • MySQL JSON 很垃圾,5.7 系列都有性能问题,测试 8.0 好很多。强烈建义大家,使用前压测一下
  • 上面提到的两点有争议?有争议就对了,一致认同是垃圾的东西谁会讨论它呢?

    实现

    JSON 有两种表示方法:文本可读的在 mysql 中对应 json_dom.cc, binary 二进制表示的对应 json_binary.cc

    If the value is a JSON object, its binary representation will have a 
    header that contains: 
     
    - the member count 
    - the size of the binary value in bytes 
    - a list of pointers to each key 
    - a list of pointers to each value 
     
    The actual keys and values will come after the header, in the same 
    order as in the header. 
     
    Similarly, if the value is a JSON array, the binary representation 
    will have a header with 
     
    - the element count 
    - the size of the binary value in bytes 
    - a list of pointers to each value 

    源码中注释也写的比较清楚,二进制分成两部分 header + element. 实际上 mysql 只是 server 识别了 json, 各个存储引擎仍存储的二进制 blob

    换句话说,底层引擎对 json 是无感知的,就是一条数据而己

    json-function-reference[1] 官方有好多在 server 层操作 json 的方法,感兴趣的可以看一下

    我们的问题

    MySQL Client 读取 json 时是 json_dom 调用 wrapper_to_string 方法,序列化成可读格式数据

    写入 json 时,是由 json_binary 调用 serialize_json_value 方法,序列化成上面图表示的 binary 数据,然后由引擎层存储成 blob 格式

    去年故障也有服务端的问题:加载单条数据失败主动 panic, 坑人不浅 (理由是数据不一致,宁可不对外提供服务,问题是那条数据恰好是重不重要的一类)。所以这个故事告诉我们: 在线服务的可用性,远高于数据一致性

    慢的原因是 wrapper_to_string 遇到 json array 特别多的情况下反复 mem_realloc 创建内存空间,导致性能下降

    其实去年没有 fix 完整,最近发现写入也有类似问题,只不过是 serialize_json_value 写入存储引擎前反复 mem_realloc 造成超时。这时前端页面发现写入超时了,(人工)重试继续写入 json 数据

    恰好赶上联合索引中有 NULL 字段,由此引出了唯一索引不唯一的现象。那怎么解决呢?前端按钮 cooldown 治标不治本,sql 执行 12s 前端肯定又点击提交了,治本还得升级 mysql 8.0 并且移除 NULL 字段, 那会不会又引入其它问题呢?

    项目初期做了错误的决定,后人很容易买单。希望我们踩到的坑,能让你决定使用 json 前犹豫几秒钟 ^^

    8.0 fix

    在测试机上发现 8.0 是 ok 的,没有性能问题,查看提交的 commit, 2016 年就有人发现并 fix 了,不知道有没有 back port 到 mysql 5.7 那几个版本

    commit a2f9ea422e4bdfd65da6dd0c497dc233629ec52e 
    Author: Knut Anders Hatlen  
    Date:   Fri Apr 1 12:56:23 2016 +0200 
     
        Bug#23031146: INSERTING 64K SIZE RECORDS TAKE TOO MUCH TIME 
     
        If a JSON value consists of a large sub-document which is wrapped in 
        many levels of JSON arrays or objects, serialization of the JSON value 
        may take a very long time to complete. 
     
        This is caused by how the serialization switches between the small 
        storage format (used by documents that need less than 64KB) and the 
        large storage format. When it detects that the large storage format 
        has to be used, it redoes the serialization of the current 
        sub-document using the large format. But this re-serialization has to 
        be redone again when the parent of the sub-document is switched from 
        small format to large format. For deeply nested documents, the inner 
        parts end up getting re-serializing again and again. 
     
        This patch changes how the switch between the formats is done. Instead 
        of starting with re-serializing the inner parts, it now starts with 
        the outer parts. If a sub-document exceeds the maximum size for the 
        small format, we know that the parent document will exceed it and need 
        to be re-serialized too. Re-serializing an inner document is therefore 
        a waste of time if we haven't already expanded its parent. By starting 
        with expanding the outer parts of the JSON document, we avoid the 
        wasted work and speed up the serialization. 

    参考资料

    [1]json-function-reference: https://dev.mysql.com/doc/refman/5.7/en/json-function-reference.html

    MySQL Json有哪些缺点 | 《Linux就该这么学》 (linuxprobe.com)

    相关推荐

    赶紧收藏!编程python基础知识,本文给你全部整理好了

    想一起学习编程Python的同学,趁我粉丝少,可以留言、私信领编程资料~Python基础入门既然学习Python,那么至少得了解下这门编程语言,知道Python代码执行过程吧。Python的历...

    创建绩效改进计划 (PIP) 的6个步骤

    每个经理都必须与未能达到期望的员工抗衡,也许他们的表现下降了,他们被分配了新的任务并且无法处理它们,或者他们处理了自己的任务,但他们的行为对他人造成了破坏。许多公司转向警告系统,然后在这些情况下终止。...

    PI3K/AKT信号通路全解析:核心分子、上游激活与下游效应分子

    PI3K/AKT/mTOR(PAM)信号通路是真核细胞中高度保守的信号转导网络,作用于促进细胞存活、生长和细胞周期进程。PAM轴上生长因子向转录因子的信号传导受到与其他多条信号通路的多重交叉相互作用的...

    互联网公司要求签PIP,裁员连N+1都没了?

    2021年刚画上句号,令无数互联网公司从业者闻风丧胆的绩效公布时间就到了,脉脉上已然炸了锅。阿里3.25、腾讯二星、百度四挡、美团绩效C,虽然名称五花八门,实际上都代表了差绩效。拿到差绩效,非但不能晋...

    Python自动化办公应用学习笔记3—— pip工具安装

    3.1pip工具安装最常用且最高效的Python第三方库安装方式是采用pip工具安装。pip是Python包管理工具,提供了对Python包的查找、下载、安装、卸载的功能。pip是Python官方提...

    单片机都是相通的_单片机是串行还是并行

    作为一个七年的从业者,单片机对于我个人而言它是一种可编程的器件,现在长见到的电子产品中几乎都有单片机的身影,它们是以单片机为核心,根据不同的功能需求,搭建不同的电路,从8位的单片机到32位的单片机,甚...

    STM32F0单片机快速入门八 聊聊 Coolie DMA

    1.苦力DMA世上本没有路,走的人多了,便成了路。世上本没有DMA,需要搬运的数据多了,便有了DMA。大多数同学应该没有在项目中用过这个东西,因为一般情况下也真不需要这个东西。在早期的单片机中...

    放弃51单片机,直接学习STM32开发可能会面临的问题

    学习51单片机并非仅仅是为了学习51本身,而是通过它学习一种方法,即如何仅仅依靠Datasheet和例程来学习一种新的芯片。51单片机相对较简单,是这个过程中最容易上手的选择,而AVR单片机则更为复杂...

    STM32串口通信基本原理_stm32串口原理图

    通信接口背景知识设备之间通信的方式一般情况下,设备之间的通信方式可以分成并行通信和串行通信两种。并行与串行通信的区别如下表所示。串行通信的分类1、按照数据传送方向,分为:单工:数据传输只支持数据在一个...

    单片机的程序有多大?_单片机的程序有多大内存

    之前一直很奇怪一个问题,每次写好单片机程序之后,用烧录软件进行烧录时,能看到烧录文件也就是hex的文件大小:我用的单片机芯片是STM32F103C8T6,程序储存器(flash)只有64K。从...

    解析STM32单片机定时器编码器模式及其应用场景

    本文将对STM32单片机定时器编码器模式进行详细解析,包括介绍不同的编码器模式、各自的优缺点以及相同点和不同点的应用场景。通过阅读本文,读者将对STM32单片机定时器编码器模式有全面的了解。一、引言...

    两STM32单片机串口通讯实验_两个32单片机间串口通信

    一、实验思路连接两个STM32单片机的串口引脚,单片机A进行发送,单片机B进行接收。单片机B根据接收到单片机A的指令来点亮或熄灭板载LED灯,通过实验现象来验证是否通讯成功。二、实验器材两套STM32...

    基于单片机的智能考勤机设计_基于51单片机的指纹考勤机

    一、设计背景随着科技水平的不断发展,在这么一个信息化的时代,智能化信息处理已是提高效率、规范管理和客观审查的最有效途径。近几年来,国内很多公司都在加强对企业人员的管理,考勤作为企业的基础管理,是公司...

    STM32单片机详细教学(二):STM32系列单片机的介绍

    大家好,今天给大家介绍STM32系列单片机,文章末尾附有本毕业设计的论文和源码的获取方式,可进群免费领取。前言STM32系列芯片是为要求高性能、低成本、低功耗的嵌入式应用设计的ARMCortexM...

    STM32单片机的 Hard-Fault 硬件错误问题追踪与分析

    有过单片机开发经验的人应该都会遇到过硬件错误(Hard-Fault)的问题,对于这样的问题,有些问题比较容易查找,有些就查找起来很麻烦,甚至可能很久都找不到问题到底是出在哪里。特别是有时候出现一次,后...