极客时间已完结课程限时免费阅读

54 | 享元模式(上):如何利用享元模式优化文本编辑器的内存占用?

54 | 享元模式(上):如何利用享元模式优化文本编辑器的内存占用?-极客时间

54 | 享元模式(上):如何利用享元模式优化文本编辑器的内存占用?

讲述:冯永吉

时长11:09大小10.22M

上一节课中,我们讲了组合模式。组合模式并不常用,主要用在数据能表示成树形结构、能通过树的遍历算法来解决的场景中。今天,我们再来学习一个不那么常用的模式,享元模式(Flyweight Design Pattern)。这也是我们要学习的最后一个结构型模式。
跟其他所有的设计模式类似,享元模式的原理和实现也非常简单。今天,我会通过棋牌游戏和文本编辑器两个实际的例子来讲解。除此之外,我还会讲到它跟单例、缓存、对象池的区别和联系。在下一节课中,我会带你剖析一下享元模式在 Java Integer、String 中的应用。
话不多说,让我们正式开始今天的学习吧!

享元模式原理与实现

所谓“享元”,顾名思义就是被共享的单元。享元模式的意图是复用对象,节省内存,前提是享元对象是不可变对象。
具体来讲,当一个系统中存在大量重复对象的时候,如果这些重复的对象是不可变对象,我们就可以利用享元模式将对象设计成享元,在内存中只保留一份实例,供多处代码引用。这样可以减少内存中对象的数量,起到节省内存的目的。实际上,不仅仅相同对象可以设计成享元,对于相似对象,我们也可以将这些对象中相同的部分(字段)提取出来,设计成享元,让这些大量相似对象引用这些享元。
这里我稍微解释一下,定义中的“不可变对象”指的是,一旦通过构造函数初始化完成之后,它的状态(对象的成员变量或者属性)就不会再被修改了。所以,不可变对象不能暴露任何 set() 等修改内部状态的方法。之所以要求享元是不可变对象,那是因为它会被多处代码共享使用,避免一处代码对享元进行了修改,影响到其他使用它的代码。
接下来,我们通过一个简单的例子解释一下享元模式。
假设我们在开发一个棋牌游戏(比如象棋)。一个游戏厅中有成千上万个“房间”,每个房间对应一个棋局。棋局要保存每个棋子的数据,比如:棋子类型(将、相、士、炮等)、棋子颜色(红方、黑方)、棋子在棋局中的位置。利用这些数据,我们就能显示一个完整的棋盘给玩家。具体的代码如下所示。其中,ChessPiece 类表示棋子,ChessBoard 类表示一个棋局,里面保存了象棋中 30 个棋子的信息。
public class ChessPiece {//棋子
private int id;
private String text;
private Color color;
private int positionX;
private int positionY;
public ChessPiece(int id, String text, Color color, int positionX, int positionY) {
this.id = id;
this.text = text;
this.color = color;
this.positionX = positionX;
this.positionY = positionX;
}
public static enum Color {
RED, BLACK
}
// ...省略其他属性和getter/setter方法...
}
public class ChessBoard {//棋局
private Map<Integer, ChessPiece> chessPieces = new HashMap<>();
public ChessBoard() {
init();
}
private void init() {
chessPieces.put(1, new ChessPiece(1, "車", ChessPiece.Color.BLACK, 0, 0));
chessPieces.put(2, new ChessPiece(2,"馬", ChessPiece.Color.BLACK, 0, 1));
//...省略摆放其他棋子的代码...
}
public void move(int chessPieceId, int toPositionX, int toPositionY) {
//...省略...
}
}
为了记录每个房间当前的棋局情况,我们需要给每个房间都创建一个 ChessBoard 棋局对象。因为游戏大厅中有成千上万的房间(实际上,百万人同时在线的游戏大厅也有很多),那保存这么多棋局对象就会消耗大量的内存。有没有什么办法来节省内存呢?
这个时候,享元模式就可以派上用场了。像刚刚的实现方式,在内存中会有大量的相似对象。这些相似对象的 id、text、color 都是相同的,唯独 positionX、positionY 不同。实际上,我们可以将棋子的 id、text、color 属性拆分出来,设计成独立的类,并且作为享元供多个棋盘复用。这样,棋盘只需要记录每个棋子的位置信息就可以了。具体的代码实现如下所示:
// 享元类
public class ChessPieceUnit {
private int id;
private String text;
private Color color;
public ChessPieceUnit(int id, String text, Color color) {
this.id = id;
this.text = text;
this.color = color;
}
public static enum Color {
RED, BLACK
}
// ...省略其他属性和getter方法...
}
public class ChessPieceUnitFactory {
private static final Map<Integer, ChessPieceUnit> pieces = new HashMap<>();
static {
pieces.put(1, new ChessPieceUnit(1, "車", ChessPieceUnit.Color.BLACK));
pieces.put(2, new ChessPieceUnit(2,"馬", ChessPieceUnit.Color.BLACK));
//...省略摆放其他棋子的代码...
}
public static ChessPieceUnit getChessPiece(int chessPieceId) {
return pieces.get(chessPieceId);
}
}
public class ChessPiece {
private ChessPieceUnit chessPieceUnit;
private int positionX;
private int positionY;
public ChessPiece(ChessPieceUnit unit, int positionX, int positionY) {
this.chessPieceUnit = unit;
this.positionX = positionX;
this.positionY = positionY;
}
// 省略getter、setter方法
}
public class ChessBoard {
private Map<Integer, ChessPiece> chessPieces = new HashMap<>();
public ChessBoard() {
init();
}
private void init() {
chessPieces.put(1, new ChessPiece(
ChessPieceUnitFactory.getChessPiece(1), 0,0));
chessPieces.put(1, new ChessPiece(
ChessPieceUnitFactory.getChessPiece(2), 1,0));
//...省略摆放其他棋子的代码...
}
public void move(int chessPieceId, int toPositionX, int toPositionY) {
//...省略...
}
}
在上面的代码实现中,我们利用工厂类来缓存 ChessPieceUnit 信息(也就是 id、text、color)。通过工厂类获取到的 ChessPieceUnit 就是享元。所有的 ChessBoard 对象共享这 30 个 ChessPieceUnit 对象(因为象棋中只有 30 个棋子)。在使用享元模式之前,记录 1 万个棋局,我们要创建 30 万(30*1 万)个棋子的 ChessPieceUnit 对象。利用享元模式,我们只需要创建 30 个享元对象供所有棋局共享使用即可,大大节省了内存。
那享元模式的原理讲完了,我们来总结一下它的代码结构。实际上,它的代码实现非常简单,主要是通过工厂模式,在工厂类中,通过一个 Map 来缓存已经创建过的享元对象,来达到复用的目的。

享元模式在文本编辑器中的应用

弄懂了享元模式的原理和实现之后,我们再来看另外一个例子,也就是文章标题中给出的:如何利用享元模式来优化文本编辑器的内存占用?
你可以把这里提到的文本编辑器想象成 Office 的 Word。不过,为了简化需求背景,我们假设这个文本编辑器只实现了文字编辑功能,不包含图片、表格等复杂的编辑功能。对于简化之后的文本编辑器,我们要在内存中表示一个文本文件,只需要记录文字和格式两部分信息就可以了,其中,格式又包括文字的字体、大小、颜色等信息。
尽管在实际的文档编写中,我们一般都是按照文本类型(标题、正文……)来设置文字的格式,标题是一种格式,正文是另一种格式等等。但是,从理论上讲,我们可以给文本文件中的每个文字都设置不同的格式。为了实现如此灵活的格式设置,并且代码实现又不过于太复杂,我们把每个文字都当作一个独立的对象来看待,并且在其中包含它的格式信息。具体的代码示例如下所示:
public class Character {//文字
private char c;
private Font font;
private int size;
private int colorRGB;
public Character(char c, Font font, int size, int colorRGB) {
this.c = c;
this.font = font;
this.size = size;
this.colorRGB = colorRGB;
}
}
public class Editor {
private List<Character> chars = new ArrayList<>();
public void appendCharacter(char c, Font font, int size, int colorRGB) {
Character character = new Character(c, font, size, colorRGB);
chars.add(character);
}
}
在文本编辑器中,我们每敲一个文字,都会调用 Editor 类中的 appendCharacter() 方法,创建一个新的 Character 对象,保存到 chars 数组中。如果一个文本文件中,有上万、十几万、几十万的文字,那我们就要在内存中存储这么多 Character 对象。那有没有办法可以节省一点内存呢?
实际上,在一个文本文件中,用到的字体格式不会太多,毕竟不大可能有人把每个文字都设置成不同的格式。所以,对于字体格式,我们可以将它设计成享元,让不同的文字共享使用。按照这个设计思路,我们对上面的代码进行重构。重构后的代码如下所示:
public class CharacterStyle {
private Font font;
private int size;
private int colorRGB;
public CharacterStyle(Font font, int size, int colorRGB) {
this.font = font;
this.size = size;
this.colorRGB = colorRGB;
}
@Override
public boolean equals(Object o) {
CharacterStyle otherStyle = (CharacterStyle) o;
return font.equals(otherStyle.font)
&& size == otherStyle.size
&& colorRGB == otherStyle.colorRGB;
}
}
public class CharacterStyleFactory {
private static final List<CharacterStyle> styles = new ArrayList<>();
public static CharacterStyle getStyle(Font font, int size, int colorRGB) {
CharacterStyle newStyle = new CharacterStyle(font, size, colorRGB);
for (CharacterStyle style : styles) {
if (style.equals(newStyle)) {
return style;
}
}
styles.add(newStyle);
return newStyle;
}
}
public class Character {
private char c;
private CharacterStyle style;
public Character(char c, CharacterStyle style) {
this.c = c;
this.style = style;
}
}
public class Editor {
private List<Character> chars = new ArrayList<>();
public void appendCharacter(char c, Font font, int size, int colorRGB) {
Character character = new Character(c, CharacterStyleFactory.getStyle(font, size, colorRGB));
chars.add(character);
}
}

享元模式 vs 单例、缓存、对象池

在上面的讲解中,我们多次提到“共享”“缓存”“复用”这些字眼,那它跟单例、缓存、对象池这些概念有什么区别呢?我们来简单对比一下。
我们先来看享元模式跟单例的区别。
在单例模式中,一个类只能创建一个对象,而在享元模式中,一个类可以创建多个对象,每个对象被多处代码引用共享。实际上,享元模式有点类似于之前讲到的单例的变体:多例。
我们前面也多次提到,区别两种设计模式,不能光看代码实现,而是要看设计意图,也就是要解决的问题。尽管从代码实现上来看,享元模式和多例有很多相似之处,但从设计意图上来看,它们是完全不同的。应用享元模式是为了对象复用,节省内存,而应用多例模式是为了限制对象的个数。
我们再来看享元模式跟缓存的区别。
在享元模式的实现中,我们通过工厂类来“缓存”已经创建好的对象。这里的“缓存”实际上是“存储”的意思,跟我们平时所说的“数据库缓存”“CPU 缓存”“MemCache 缓存”是两回事。我们平时所讲的缓存,主要是为了提高访问效率,而非复用。
最后我们来看享元模式跟对象池的区别。
对象池、连接池(比如数据库连接池)、线程池等也是为了复用,那它们跟享元模式有什么区别呢?
你可能对连接池、线程池比较熟悉,对对象池比较陌生,所以,这里我简单解释一下对象池。像 C++ 这样的编程语言,内存的管理是由程序员负责的。为了避免频繁地进行对象创建和释放导致内存碎片,我们可以预先申请一片连续的内存空间,也就是这里说的对象池。每次创建对象时,我们从对象池中直接取出一个空闲对象来使用,对象使用完成之后,再放回到对象池中以供后续复用,而非直接释放掉。
虽然对象池、连接池、线程池、享元模式都是为了复用,但是,如果我们再细致地抠一抠“复用”这个字眼的话,对象池、连接池、线程池等池化技术中的“复用”和享元模式中的“复用”实际上是不同的概念。
池化技术中的“复用”可以理解为“重复使用”,主要目的是节省时间(比如从数据库池中取一个连接,不需要重新创建)。在任意时刻,每一个对象、连接、线程,并不会被多处使用,而是被一个使用者独占,当使用完成之后,放回到池中,再由其他使用者重复利用。享元模式中的“复用”可以理解为“共享使用”,在整个生命周期中,都是被所有使用者共享的,主要目的是节省空间。

重点回顾

好了,今天的内容到此就讲完了。我们来一块总结回顾一下,你需要重点掌握的内容。
1. 享元模式的原理
所谓“享元”,顾名思义就是被共享的单元。享元模式的意图是复用对象,节省内存,前提是享元对象是不可变对象。具体来讲,当一个系统中存在大量重复对象的时候,我们就可以利用享元模式,将对象设计成享元,在内存中只保留一份实例,供多处代码引用,这样可以减少内存中对象的数量,以起到节省内存的目的。实际上,不仅仅相同对象可以设计成享元,对于相似对象,我们也可以将这些对象中相同的部分(字段),提取出来设计成享元,让这些大量相似对象引用这些享元。
2. 享元模式的实现
享元模式的代码实现非常简单,主要是通过工厂模式,在工厂类中,通过一个 Map 或者 List 来缓存已经创建好的享元对象,以达到复用的目的。
3. 享元模式 VS 单例、缓存、对象池
我们前面也多次提到,区别两种设计模式,不能光看代码实现,而是要看设计意图,也就是要解决的问题。这里的区别也不例外。
我们可以用简单几句话来概括一下它们之间的区别。应用单例模式是为了保证对象全局唯一。应用享元模式是为了实现对象复用,节省内存。缓存是为了提高访问效率,而非复用。池化技术中的“复用”理解为“重复使用”,主要是为了节省时间。

课堂讨论

在棋牌游戏的例子中,有没有必要把 ChessPiecePosition 设计成享元呢?
在文本编辑器的例子中,调用 CharacterStyleFactory 类的 getStyle() 方法,需要在 styles 数组中遍历查找,而遍历查找比较耗时,是否可以优化一下呢?
欢迎留言和我分享你的想法。如果有收获,也欢迎你把这篇文章分享给你的朋友。
分享给需要的人,Ta购买本课程,你将得29
生成海报并分享

赞 48

提建议

上一篇
53 | 组合模式:如何设计实现支持递归遍历的文件系统目录树结构?
下一篇
55 | 享元模式(下):剖析享元模式在Java Integer、String中的应用
 写留言

精选留言(76)

  • Ken张云忠
    2020-03-06
    1.在棋牌游戏的例子中,有没有必要把 ChessPiecePosition 设计成享元呢? 没有必要,设计成享元模式主要是为了节省内存资源. ChessPiece中的positionX和positionY共占用8个字节,而把ChessPiecePosition设计成享元模式,ChessPiecePosition的引用在ChessPiece中也是占用8个字节,反而还需要额外的内存空间来存放棋盘中各个位置的对象,最终就得不偿失了. 当启用压缩指针时,ChessPiece对象占用(12+4+4+补4)24个字节, 当不启用压缩指针时,ChessPiece对象占用(16+4+补4+8)32个字节. 2.在文本编辑器的例子中,调用 CharacterStyleFactory 类的 getStyle() 方法,需要在 styles 数组中遍历查找,而遍历查找比较耗时,是否可以优化一下呢? 用map来存储数据CharacterStyle,重写CharacterStyle的hash方法,查找时就创建出新的对象来获取该hash值,用该hash值在map中查找是否存在,如果存在就直接返回,如果不存在就先添加到map中再返回.
    展开
    共 27 条评论
    178
  • 李湘河
    2020-03-08
    补充一下,对于第二个问题,用LinkedHashMap容器并开启它的LRU策略来装CharacterStyle更好,因为根据一个使用者的习惯,常用的字体风格就是自己最近使用的。
    共 1 条评论
    41
  • Xion
    2020-03-06
    1. 没有必要,每局游戏的棋子位置不是完全相同的数据,这取决于用户的输入,随着时间的推移会不断地变化。而使用享元模式保存的数据,应当是那些不变的,会被大量对象复用的数据。 2.可以考虑使用哈希表保存文本格式,用多出来的一点点空间占用换取O(1)的查询效率。
    共 3 条评论
    19
  • 前端西瓜哥
    2020-03-07
    1. 没有必要。棋盘上位置的点集是有限的,是可以设计成享元的。但我们只需要存两个很小的整数,用上享元代码就会变复杂,另外指针也要存储空间。设计成享元可以,但没有必要。 2. 用哈希表提高查询速度:将 font, size, style 连接为字符串(比如 'yahei-12-123456')作为 hash 表的 key。
    共 3 条评论
    16
  • Wh1
    2020-03-06
    小争哥你好,采用享元模式重构的代码中,CharacterStyleFactory的getStyle()函数是不是设计的有问题。无论styles中是否存在已经创建好的享元对象,都会新建一个CharacterStyle对象。照这么看,styles岂不是根本就没有存在的必要了。 我认为代码应该改为如下: public static CharacterStyle getStyle(Font font, int size, int colorRGB) { //遍历styles, 如果styles中有相同对象, 则返回 for (CharacterStyle style : styles) { if (style.equals(font, size, colorRGB)) { return style; } } CharacterStyle newStyle = new CharacterStyle(font, size, colorRGB); styles.add(newStyle); return newStyle; }
    展开
    共 9 条评论
    11
  • Wh1
    2020-03-06
    在避免创建CharacterStyle对象同时,以O(1)的时间复杂度判断CharacterStyle是否已经被创建,代码如下: public class CharacterStyleFactory { private static final Map<Integer, CharacterStyle> styles = new HashMap<>(); public static CharacterStyle getStyle(Font font, int size, int colorRGB) { //key = font的哈希值 + size + colorRGB 以保证哈希值唯一性, 同时也避免了重复创建CharacterStyle的开销 int key = font.hashCode() + size + colorRGB; if (styles.containsKey(key)) { return styles.get(key); } CharacterStyle newStyle = new CharacterStyle(font, size, colorRGB); styles.put(key, newStyle); return newStyle; } }
    展开
    共 2 条评论
    10
  • Jackey
    2020-03-06
    前面看的时候就在想感觉有点像连接池,当看到一个“共享使用”,一个“重复使用”时真是有种恍然大悟的感觉
    共 4 条评论
    8
  • 天草二十六
    2020-09-11
    难道就我一个人有疑问?象棋不是总共32个棋子吗,争哥咋说30个享元对象?

    作者回复: ������

    共 7 条评论
    7
  • Monday
    2020-03-14
    private void init() { chessPieces.put(1, new ChessPiece( ChessPieceUnitFactory.getChessPiece(1), 0,0)); chessPieces.put(1, new ChessPiece( ChessPieceUnitFactory.getChessPiece(2), 1,0)); //...省略摆放其他棋子的代码... } 这段代码的第2个put的key应该是2吧
    展开
    5
  • Heaven
    2020-03-12
    对于问题一,首先说,围棋棋盘有361个点,如果将位置封装成享元模式,要封装361个对象,如果拥有大量的棋盘去共享这些位置,那么是可以节省内存的,但是我个人倾向于不使用享元,我们来表示位置的数据类型是int,有本身自带的享元对象池,做到了一定的复用,不需要占用太多的内存,而且使用享元对象,在查找享元对象的过程,也需要消耗一定的时间,所以没有必要去为了4个字节浪费那么多的事情 对于问题二,这就是一个简单的空间换时间的问题,时间耗时长,那么就用一个空间问题来解决,可以使用一个散列表来进行相关的存储,在Java中更是简单,直接使用Map对象即可
    展开
    5
  • hhhh
    2020-03-06
    课后思考题: 1. position可以使用享元模式,但是对于位置信息而言,两个short类型的整数可以表示, 大量的位置信息也不会占据太多的存储空间,使用享元模式一定程度上增加了代码实现的复杂度,造成move() 方法代码不够直观 2. 重写CharacterStyle 的hashcode()方法,使用map作为对象池,map的key就是hashcode()的值
    展开
    共 2 条评论
    5
  • Frank
    2020-03-06
    打卡 今日学习享元设计模式,收获如下: 当某个需求中有大量的对象是相似的(或者对象中的某些属性是类似的),且是不可变的,此时可以使用享元设计模式将其进行缓存起来以达到共享使用,节省内存。 个人觉得享元模式体现了DRY原则,DRY原则是说不要写重复的代码,应用到对象存储方面,可以理解为不要存储相同的数据。
    5
  • 百川
    2021-06-05
    一万个棋局,虽然只有 30个 ChessPieceUnit 了,但是不是依然有 30万个 ChessPiece呢?
    5
  • djfhchdh
    2020-03-16
    关于思考题1,感觉将位置设置成享元也可以啊,因为棋盘的位置是有限且固定的
    5
  • zx
    2020-03-10
    对于百万在线的系统,棋盘的位置数量是有限的,可以设计为享元模式
    4
  • Laughing
    2020-11-20
    1. 第一个问题看需求,如果像象棋类的网格棋,可以考虑享元模式 2. map存储,减少迭代查找

    作者回复: 嗯嗯 ������

    3
  • xk_
    2020-04-17
    像连接池、线程池。我们使用它们的时候,在初始化时会创建好连接或者是线程,在使用的时候就可以直接使用,不需要创建了,节省了创建的时间。 享元模式是共享对象的,是存在于内存中,在设计模式出来的时候,内存条可是嗷嗷贵的啊!在当时节省一点内存,真的是非常高大上的一件事了!
    3
  • 郑大钱
    2021-04-08
    虽然设计模式和设计模式之间非常的相似,但是设计他们的初衷就是为了解决某一个特定问题的,不要用混了。 越来越专业的标准是越来越知道边界。
    2
  • SeamanW
    2020-07-17
    要不要把文字编辑器中的文字设计成享元呢? 正方:常用汉字也就3000多个,超过3000字原则上就需要 反方:设计成享元能节省多少空间呢?或者会不会更浪费空间? 哈哈😄

    作者回复: 是个值得讨论的问题~

    2
  • change
    2020-03-28
    1、享元即可共享的单元,目的是为了复用对象,节省内存,前提条件是对象不可变; 2、借助于工厂模式,用List或Map缓存已经创建的享元对象,以达到复用的目的; 3、享元模式 VS 单例模式、缓存、池化技术:不仅看代码实现,还要看设计意图(即解决的问题) 3.1、单例只能创建一个对象,多例虽然可以创建多个对象,其目的是为了限制对象的个数,享元模式可创建多个对象,且一个对象可被代码多个地方调用,其目的是复用对象,节省内存; 3.2、缓存是为了提供访问效率,而不是节省内存够; 3.3、池化技术虽然也是为了复用(重复使用),但是是为了节省时间,而享元模式的复用(共享使用),为了节省空间;
    展开
    1