百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

多年的教训:根据DDD设计原则改变JPA/Hibernate的使用方式

liuian 2025-07-08 20:04 2 浏览

我(lorenzo)最近一直在更新一些培训材料,思考JPA更好的教学方法和讨论方式。我一直在思考的一件事是我们通常是如何使用JPA?这里结合我所经历的(和观察到的)痛苦,应该如何改变传统使用方式?

JPA通常被视为一组注释(或XML文件),它们提供O/R(对象关系)映射信息。大多数开发人员认为他们知道和使用的映射注释越多,他们得到的好处就越多。但是在过去的几年里,与中小规模的巨石/单体/整体系统(大约有200张表/实体)的搏斗教会了我一些别的东西。

教训:

  • 按ID引用实体(仅映射聚合中的实体关系)
  • 不要让JPA窃取你的ID(尽可能避免@GeneratedValue)
  • 使用特殊join来join不相关的实体

按标识符ID引用实体

仅映射DDD聚合中的实体关系。

传统 JPA或Hibernate教程(和培训)通常会涵盖所有可能的实体关系映射。在教学基本映射之后,许多映射将从简单的单向@manytone映射开始。然后继续双向@OneToMany和@ManyToOne。不幸的是,大多数情况下,他们没有明确指出,这种映射关系不是很好。因此,初学者在完成训练时往往会认为,不映射相关实体是错误的。他们错误地认为外键字段必须映射为相关实体。

@Entity
public class SomeEntity {
    // ...
    @ManyToOne private Country country;
    // ...
}
 
@Entity
public class Country {
    @Id private String id; // e.g. US, JP, CN, CA, GB, PH
    // ...
}

将上面@ManyToOne 应该改为@Column,将相关实体的主键映射为一个字段即可:

@Entity
public class SomeEntity {
    // ...
    @Column private String countryId;
    // ...
}
 
@Entity
public class Country {
    @Id private String id; // e.g. US, JP, CN, CA, GB, PH
    // ...
}

映射所有实体关系会增加了不必要的遍历的机会,这通常会导致不必要的内存消耗。这也会导致不必要的EntityManager操作级联。

如果您只处理少数几个实体/表,这可能并不多。但是当与几十个(如果不是几百个)实体一起工作时,它就变成了维护的噩梦。

何时映射相关实体?

仅当相关实体位于聚合中时才映射它们(在DDD中)。

聚合是领域驱动设计中的一种模式。DDD聚合是可以作为单个单元处理的域对象的集群。例如订单及其行项目,它们将是单独的对象,但将订单(及其行项目)视为单个聚合非常有用。

https://martinfowler.com/bliki/DDD_Aggregate.html

@Entity
public class Order {
    // ...
    @OneToMany(mappedBy = "order", ...) private List<OrderItem> items;
    // ...
}
 
@Entity
public class OrderItem {
    // ...
    @ManyToOne(optional = false) private Order order;
    // ...
}

更现代的聚合设计方法提倡在聚合之间进行更干净的分离。通过存储聚合根的ID(唯一标识符)而不是完整的引用来引用聚合根是一种很好的做法。

如果我们展开上面的简单订单示例,那么行项目(OrderItem类)不应该有到产品的@ManyToOne映射,相反,它应该只有产品的ID:

@Entity
public class Order {
    // ...
    @OneToMany(mappedBy = "order", ...) private List<OrderItem> items;
    // ...
}
 
@Entity
public class OrderItem {
    // ...
    @ManyToOne(optional = false) private Order order;
    // @ManyToOne private Product product; // <-- Avoid this!
    @Column private ... productId;
    // ...
}

但是…如果产品(聚合根实体)的@Id字段映射为@GeneratedValue呢?我们是否必须先持久化/flush刷新,然后使用生成的ID值?

那么,join呢?我们还能在JPA中Join这些实体吗?

别让JPA偷走你的标识

使用@GeneratedValue最初可能会使映射简单易用。但是,当您开始通过ID(而不是通过映射关系)引用其他实体时,这将成为一个挑战。

如果产品(聚合根实体)的@Id字段映射为@GeneratedValue,则调用getId()可能返回null。当它返回null时,行项目(OrderItem类)将无法引用它!

在所有实体都有一个非空Id字段的环境中,按Id引用任何实体都会变得更容易。此外,始终具有非空的Id字段,使得equals(Object)和hashCode()更容易实现。

因为所有Id字段都显式初始化,所以所有(聚合根)实体都有一个接受Id字段值的公共构造函数。可以添加一个受保护的no-args构造函数来让JPA满意。

@Entity
public class Order {
    @Id private Long id;
    // ...
    public Order(Long id) {
        // ...
        this.id = id;
    }
    public Long getId() { return id; }
    // ...
    protected Order() { /* as required by ORM/JPA */ }
}

在写这篇文章的时候,我发现了James Brundege的一篇文章(2006年发布的), Don't Let Hibernate Steal Your Identity (感谢Wayback Machine),他说,不要让Hibernate管理你的Id。但愿我早点听他的劝告。

但要小心!当使用Spring Data JPA save()保存一个在其@Id字段上不使用@GeneratedValue的实体时,在预期的INSERT之前会发出一个不必要的SQL SELECT。这是由于SimpleJpaRepository的save()方法(如下所示)。它依赖于@Id字段(非空值)的存在来确定是调用persist(Object)还是merge(Object)。

public class SimpleJpaRepository // ...
    @Override
    public <S extends T> save(S entity) {
        // ...
        if (entityInformation.isNew(entity)) {
            em.persist(entity);
            return entity;
        } else {
            return em.merge(entity);
        }
    }
}

精明的读者会注意到,如果@Id字段从不为null,save()方法将始终调用merge()。这会导致不必要的SQL SELECT(在预期的INSERT之前)。

幸运的是,解决方法很简单-实现 Persistable<ID>.

@MappedSuperclass
public abstract class BaseEntity<ID> implements Persistable<ID> {
    @Transient
    private boolean persisted = false;
    @Override
    public boolean isNew() {
        return !persisted;
    }
    @PostPersist
    @PostLoad
    protected void setPersisted() {
        this.persisted = true;
    }
}
以上还意味着对实体的所有更新都必须首先将现有实体加载到持久性上下文中,然后将更改应用到托管实体。

使用特殊Join连接来join不相关的实体

那么,连接join呢?既然我们通过ID引用了其他实体,那么如何在JPA中连接join不相关的实体呢?

在jpa2.2版本中,不相关的实体不能连接。但是,我无法确认这是否已经成为3.0版的标准,在3.0版中,所有javax.persistence引用都被重命名为jakarta.persistence。

给定OrderItem实体,缺少@manytone映射会导致它无法与产品实体联接。

@Entity
public class Order {
    // ...
}
 
@Entity
public class OrderItem {
    // ...
    @ManyToOne(optional = false) private Order order;
    @Column private ... productId;
    // ...
}

值得庆幸的是,Hibernate 5.1.0+(2016年发布)和EclipseLink 2.4.0+(2012年发布)一直在支持无关实体的连接。这些连接也称为特殊连接 ad-hoc joins。

SELECT o
  FROM Order o
  JOIN o.items oi
  JOIN Product p ON (p.id = oi.productId) -- supported in Hibernate and EclipseLink

另外,这也是一个API问题(支持两个根实体的JOIN/ON)。我真的希望它能很快成为一种标准。

相关推荐

Python tkinter学习笔记(七):Notebook和Treeview

‘Pythontkinter’是Python自带的GUI工具包,非常适合开发小型的GUI应用。最近使用‘tkinter’开发了一些自己日常使用的小工具,效果不错,于是把开发过程中学习到的一些tkin...

如何用 Python实现简单的表格界面

Excel有表格编辑功能,为什么我还要弄一个,不是多此一举么。道理是对的,但是很多会员功能才更加强大,不是吗?我们学语言,一来可以练习编码熟练的,巩固知识点,更重要的是你熟悉开发,以后如果你想实现一...

土地增值税清算中的施工合同进行判断是否有重复施工的情况

对土地增值税清算中的施工合同进行判断是否有重复施工的情况,使用Python中的Pandas库对施工合同的相关数据进行处理,基于文本相似度进行判断。1.读取施工内容数据:将施工内容数据存储在一个...

大模型时代必备技能:Embedding与向量数据库开发完全指南

本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在官网-聚客AI学院大模型应用开发微调项目实践课程学习平台一.Embeddings与向量数据库1.1Embeddings的...

分布式实时搜索和分析引擎——Elasticsearch

一、概述Elasticsearch是一个基于Lucene的搜索引擎。它提供了具有HTTPWeb界面和无架构JSON文档的分布式,多租户能力的全文搜索引擎。Elasticsearch是用Java开发的...

elasticsearch v9.0.0重磅发布!解锁最新核心特性与性能飞跃!

时隔3年,Elasticsearch迎来重大版本更新!基于Lucene10.1.0构建,9.0.0版本在AI搜索、安全分析、向量计算、集群管理等多个领域实现突破性升级版本亮点o新...

Java中间件-Elasticsearch(java中间件技术及其应用开发)

Elasticsearch是一个非常强大的搜索引擎。它目前被广泛地使用于各个IT公司。Elasticsearch是由Elastic公司创建。它的代码位于GitHub-elastic/...

知名互联网公司和程序员都看好的数据库是什么?

2017年数据库领域的最大趋势是什么?什么是最热的数据处理技术?学什么数据库最有前途?程序员们普遍不喜欢的数据库是什么?本文都会一一揭秘。大数据时代,数据库的选择备受关注,此前本号就曾揭秘国内知名互联...

快速了解Elasticsearch(快速了解词语浑话的读音、释义等知识点)

Elasticsearch是一款基于Lucene的开源分布式全文搜索引擎,它支持实时搜索,具有优秀的可扩展性和可靠性。作为一款搜索引擎,Elasticsearch提供了丰富的API,使得开发人员可以通...

面试官:Kafka和ES选主有什么区别?

Kafka和ES都是用来处理大数据的中间件,一个是消息中间件的代表(Kafka),另一个是大数据搜索引擎的代表(ES)。它们在Java领域的使用非常广泛,在大数据方面就更不用说了,但它们的选...

ElasticSearch 23 种映射参数详解

ElasticSearch系列教程我们前面已经连着发了四篇了,今天第五篇,我们来聊一聊Es中的23种常见的映射参数。针对这23种常见的映射参数,松哥专门录制了一个视频教程:视频链接:...

还不会Elasticsearch?看这些知识入门刚刚好

作者:MacroZheng链接:https://juejin.im/post/5e8c7d65518825736512d097记得刚接触Elasticsearch的时候,没找啥资料,直接看了遍Ela...

Elasticsearch学习,请先看这一篇!

题记:Elasticsearch研究有一段时间了,现特将Elasticsearch相关核心知识、原理从初学者认知、学习的角度,从以下9个方面进行详细梳理。欢迎讨论……0.带着问题上路——ES是如何产...

Elasticsearch企业级应用全景图:原理/场景/优化/避坑四重奏

一、核心概念与架构原理1.基本定义Elasticsearch是基于ApacheLucene构建的分布式实时搜索与分析引擎,具有以下核心特性:分布式架构:支持PB级数据水平扩展近实时(NRT):数据...

ELK Stack系列之基础篇(八) - Elasticsearch原理总结(图示)

前言通过前面的知识,我们已经了解到了ELk到底是什么、以及他们的工作原理、ES集群架构、专有名词的一些解释。在进入下一阶段ES实操学习环节前,那么今天我将以图解的方式将ELK重点以及ES的相关逻辑进行...