百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

面试系列 - 序列化和反序列化详解

liuian 2025-05-16 14:47 33 浏览

Java 序列化是一种将对象转换为字节流的过程,可以将对象的状态保存到磁盘文件或通过网络传输。反序列化则是将字节流重新转换为对象的过程。Java 提供了一个强大的序列化框架,允许你在对象的持久化和网络通信中使用它。

一、Java 序列化的基本原理

Java 序列化的基本原理是将一个 Java 对象转换为一个字节序列,以便将其保存到磁盘上的文件或通过网络发送到其他地方。这个字节序列可以随后被反序列化为原始对象。

Java 序列化的主要实现是通过 java.io.Serializable 接口来实现的。只有实现了这个接口的类才能被序列化。该接口没有任何方法,它只是一个标识接口,用来表示一个类的实例可以被序列化。

要序列化一个对象,你可以使用 ObjectOutputStream 类,将对象写入输出流。要反序列化一个对象,可以使用 ObjectInputStream 类,从输入流中读取字节并重新构建对象。

以下是一个简单的 Java 序列化和反序列化的示例:

import java.io.*;

class Student implements Serializable {
    private String name;
    private int age;

    public Student(String name, int age) {
        this.name = name;
        this.age = age;
    }

    public String toString() {
        return "Name: " + name + ", Age: " + age;
    }
}

public class SerializationExample {
    public static void main(String[] args) {
        // 创建一个 Student 对象
        Student student = new Student("Alice", 25);

        // 序列化对象到文件
        try (FileOutputStream fileOut = new FileOutputStream("student.ser");
             ObjectOutputStream out = new ObjectOutputStream(fileOut)) {
            out.writeObject(student);
            System.out.println("Object has been serialized");
        } catch (IOException e) {
            e.printStackTrace();
        }

        // 反序列化对象
        try (FileInputStream fileIn = new FileInputStream("student.ser");
             ObjectInputStream in = new ObjectInputStream(fileIn)) {
            Student deserializedStudent = (Student) in.readObject();
            System.out.println("Object has been deserialized");
            System.out.println(deserializedStudent);
        } catch (IOException | ClassNotFoundException e) {
            e.printStackTrace();
        }
    }
}


在这个示例中,我们首先创建一个 Student 类,并实现了 Serializable 接口。然后,我们创建一个 Student 对象,将其序列化到名为 "student.ser" 的文件中,并通过反序列化重新构建对象。

二、序列化版本UID

Java 对象在序列化时,会自动生成一个序列化版本UID(serialVersionUID),它是一个64位的哈希码,用于标识对象的版本。当对象被反序列化时,Java 会比较传入对象的版本UID和类中声明的版本UID是否匹配,如果不匹配,将抛出 InvalidClassException。

你可以显式地声明版本UID,以确保对象在类结构变化时仍然可以正确反序列化。例如:

private static final long serialVersionUID = 123456789L;


三、注意事项和最佳实践

  • 序列化是 Java 中用于对象持久化的一种方式,但不适合所有情况。要慎重选择是否使用序列化,特别是在分布式系统中。
  • 被序列化的类必须实现 Serializable 接口,而且要小心处理敏感信息,如密码等,不要序列化敏感数据。
  • 在反序列化时,要确保类的版本和序列化时相同,否则可能会导致版本不匹配的问题。
  • 序列化和反序列化可能会对性能产生一定的影响,因此在高性能要求的场景中要小心使用。

四、常见序列化协议

常见的序列化协议有很多,它们用于在不同的应用和平台之间序列化和反序列化数据。

  1. Java 序列化(Java Serialization): Java 标准库中的序列化机制,用于将 Java 对象序列化为字节流,以便在不同 Java 应用之间进行数据传输和持久化。这种序列化方式使用 java.io.Serializable 接口。
  2. JSON(JavaScript Object Notation): 一种轻量级的数据交换格式,易于阅读和编写。JSON 可以在不同的编程语言之间进行数据交换,广泛用于 Web 开发和 RESTful API。
  3. XML(eXtensible Markup Language): 一种通用的标记语言,用于将结构化数据序列化为文本格式。XML 也可用于不同编程语言之间的数据交换,尤其在企业级应用中广泛使用。
  4. Protocol Buffers(Protobuf): Google 开发的一种轻量级的二进制数据序列化协议,它具有高效的编解码性能和紧凑的数据表示。Protobuf 支持多种编程语言。
  5. Apache Avro: 一种数据序列化框架,支持多种编程语言。Avro 使用 JSON 格式来定义数据结构,并可以将数据序列化为二进制格式。
  6. Thrift: 由 Facebook 开发的一种跨语言的远程过程调用(RPC)框架,支持多种数据序列化格式,包括二进制、JSON 和 XML。
  7. MessagePack: 一种高效的二进制序列化格式,通常用于在不同平台之间传输数据。它比 JSON 和 XML 更紧凑,解析速度更快。
  8. CBOR(Concise Binary Object Representation): 一种二进制序列化格式,旨在与 JSON 兼容,但比 JSON 更紧凑和高效。
  9. BSON(Binary JSON): 一种二进制 JSON 格式,主要用于 MongoDB 数据库的存储和交换。
  10. Hessian 和 Burlap: 由 Caucho Technology 开发的一组二进制序列化协议,用于远程过程调用和数据交换。

这些序列化协议各有优点和适用场景,你可以根据项目的需求和技术栈来选择合适的协议。例如,如果需要高效的二进制序列化和跨语言支持,Protocol Buffers 或 MessagePack 可能是不错的选择;如果需要易读的数据交换格式,JSON 或 XML 可能更合适。

五、序列化协议对应于 TCP/IP 4 层模型

序列化协议通常不直接对应于 TCP/IP 4 层模型中的任何一层。TCP/IP 4 层模型包括以下层级:

  1. 应用层(Application Layer): 应用层协议负责定义应用程序之间的通信规则和数据交换格式。序列化协议通常在这一层中使用,以便将应用程序的数据序列化为可在网络上传输的格式。
  2. 传输层(Transport Layer): 传输层协议负责在网络上可靠地传输数据。TCP(传输控制协议)和UDP(用户数据报协议)是传输层协议的例子。序列化协议不属于传输层,但序列化后的数据可以通过传输层协议传输。
  3. 网络层(Network Layer): 网络层负责在不同网络之间路由数据包。IP(Internet Protocol)是网络层的核心协议。序列化协议通常不直接与网络层相关。
  4. 数据链路层(Data Link Layer): 数据链路层负责将数据帧从一个物理介质传输到另一个物理介质,通常与网络硬件相关。这一层与序列化协议无关。

序列化协议通常位于应用层,它定义了如何将应用程序中的数据序列化为可传输的格式,以及如何在接收端反序列化这些数据。然后,这些序列化后的数据可以使用传输层协议(如TCP或UDP)进行传输,以便在网络上进行数据交换。

六、serialVersionUID作用

serialVersionUID 是 Java 中用于序列化版本控制的一个特殊字段。它是一个静态常量,用于标识类的不同版本,以确保在反序列化过程中,序列化的类与反序列化的类具有兼容的版本。

serialVersionUID 的作用包括:

  1. 版本兼容性: 当类的结构发生变化(例如添加、删除或修改字段,或者改变继承关系)时,serialVersionUID 可以确保在反序列化时不会导致版本不匹配的问题。如果反序列化时发现版本不匹配,会抛出 InvalidClassException。
  2. 允许反序列化旧版本: 如果你需要反序列化之前版本的对象,可以通过指定旧版本的 serialVersionUID 来实现。这允许你在升级应用程序时仍然能够处理旧版本的序列化数据。
  3. 避免不必要的异常: 如果没有明确指定 serialVersionUID,Java 将根据类的结构自动生成一个版本号。但是,如果类的结构发生了变化,自动生成的版本号可能会导致不匹配的异常。通过显式设置 serialVersionUID,可以避免这种情况。

七、如果有些字段不想进行序列化怎么办

如果你希望某些字段不参与序列化,你可以使用 transient 关键字来标记这些字段。被 transient 修饰的字段不会被序列化,它们在序列化过程中会被忽略。当对象被反序列化时,这些字段会被赋予默认值。

以下是示例:

import java.io.Serializable;

public class MyClass implements Serializable {
    private String name;
    private transient int age; // age 字段不会被序列化
    
    public MyClass(String name, int age) {
        this.name = name;
        this.age = age;
    }
    
    // 其他成员变量和方法
}


在上面的示例中,age 字段被标记为 transient,这意味着在将 MyClass 对象序列化时,age 字段的值不会被包括在序列化数据中。当你反序列化 MyClass 对象时,age 字段会被赋予其默认值(0 对于 int 类型)。

使用 transient 关键字是一种常见的方式来控制哪些字段需要被序列化,哪些字段不需要。通常,不需要序列化的字段包括临时状态或不适合在序列化过程中传输的数据。例如,密码字段通常被标记为 transient,以确保它们不会在网络传输或持久化到磁盘时泄漏。

相关推荐

总结下SpringData JPA 的常用语法

SpringDataJPA常用有两种写法,一个是用Jpa自带方法进行CRUD,适合简单查询场景、例如查询全部数据、根据某个字段查询,根据某字段排序等等。另一种是使用注解方式,@Query、@Modi...

解决JPA在多线程中事务无法生效的问题

在使用SpringBoot2.x和JPA的过程中,如果在多线程环境下发现查询方法(如@Query或findAll)以及事务(如@Transactional)无法生效,通常是由于S...

PostgreSQL系列(一):数据类型和基本类型转换

自从厂子里出来后,数据库的主力就从Oracle变成MySQL了。有一说一哈,贵确实是有贵的道理,不是开源能比的。后面的工作里面基本上就是主MySQL,辅MongoDB、ES等NoSQL。最近想写一点跟...

基于MCP实现text2sql

目的:基于MCP实现text2sql能力参考:https://blog.csdn.net/hacker_Lees/article/details/146426392服务端#选用开源的MySQLMCP...

ORACLE 错误代码及解决办法

ORA-00001:违反唯一约束条件(.)错误说明:当在唯一索引所对应的列上键入重复值时,会触发此异常。ORA-00017:请求会话以设置跟踪事件ORA-00018:超出最大会话数ORA-00...

从 SQLite 到 DuckDB:查询快 5 倍,存储减少 80%

作者丨Trace译者丨明知山策划丨李冬梅Trace从一开始就使用SQLite将所有数据存储在用户设备上。这是一个非常不错的选择——SQLite高度可靠,并且多种编程语言都提供了广泛支持...

010:通过 MCP PostgreSQL 安全访问数据

项目简介提供对PostgreSQL数据库的只读访问功能。该服务器允许大型语言模型(LLMs)检查数据库的模式结构,并执行只读查询操作。核心功能提供对PostgreSQL数据库的只读访问允许L...

发现了一个好用且免费的SQL数据库工具(DBeaver)

缘起最近Ai不是大火么,想着自己也弄一些开源的框架来捣腾一下。手上用着Mac,但Mac都没有显卡的,对于学习Ai训练模型不方便,所以最近新购入了一台4090的拯救者,打算用来好好学习一下Ai(呸,以上...

微软发布.NET 10首个预览版:JIT编译器再进化、跨平台开发更流畅

IT之家2月26日消息,微软.NET团队昨日(2月25日)发布博文,宣布推出.NET10首个预览版更新,重点改进.NETRuntime、SDK、libraries、C#、AS...

数据库管理工具Navicat Premium最新版发布啦

管理多个数据库要么需要使用多个客户端应用程序,要么找到一个可以容纳你使用的所有数据库的应用程序。其中一个工具是NavicatPremium。它不仅支持大多数主要的数据库管理系统(DBMS),而且它...

50+AI新品齐发,微软Build放大招:拥抱Agent胜算几何?

北京时间5月20日凌晨,如果你打开微软Build2025开发者大会的直播,最先吸引你的可能不是一场原本属于AI和开发者的技术盛会,而是开场不久后的尴尬一幕:一边是几位微软员工在台下大...

揭秘:一条SQL语句的执行过程是怎么样的?

数据库系统能够接受SQL语句,并返回数据查询的结果,或者对数据库中的数据进行修改,可以说几乎每个程序员都使用过它。而MySQL又是目前使用最广泛的数据库。所以,解析一下MySQL编译并执行...

各家sql工具,都闹过哪些乐子?

相信这些sql工具,大家都不陌生吧,它们在业内绝对算得上第一梯队的产品了,但是你知道,他们都闹过什么乐子吗?首先登场的是Navicat,这款强大的数据库管理工具,曾经让一位程序员朋友“火”了一把。Na...

详解PG数据库管理工具--pgadmin工具、安装部署及相关功能

概述今天主要介绍一下PG数据库管理工具--pgadmin,一起来看看吧~一、介绍pgAdmin4是一款为PostgreSQL设计的可靠和全面的数据库设计和管理软件,它允许连接到特定的数据库,创建表和...

Enpass for Mac(跨平台密码管理软件)

还在寻找密码管理软件吗?密码管理软件有很多,但是综合素质相当优秀且完全免费的密码管理软件却并不常见,EnpassMac版是一款免费跨平台密码管理软件,可以通过这款软件高效安全的保护密码文件,而且可以...