首页 > 编程笔记 > Java笔记

String中的享元模式

Java 中 String 类由 final 修饰,即不可改变的。在 JVM 中,字符串一般被保存在字符串常量池中,且 Java 会确保一个字符串在常量池中只有一个“复制”。字符串常量池在 JDK6 之前位于永久代,而在 JDK7 中,JVM 将其放置于堆中。

这里我们不谈堆栈,只简单引入了常量池这个简单的概念。常量池(Constant Pool)指的是在编译期被确定,并被保存在已编译的 .class 文件中的一些数据。它包括了关于类、方法、接口、字符串等常量。字符串常量池指对应常量池中存储 String 常量的区域。

下面我们做一个简单的测试,代码如下:
public class Test {
    public static void main(String[] args) {
        String s1 = "hello";
        String s2 = "hello";
        String s3 = "he" + "1lo";
        String s4 = "hel" + new String("lo");
        String s5 = new String("hello");
        String s6 = s5.intern();
        String s7 = "h";
        String s8 = "ello";
        String s9 = s7 + s8;
        System.out.println(s1 == s2);    //true
        System.out.println(s1 == s3);    //true
        System.out.println(s1 == s4);    //false
        System.out.println(s1 == s9);    //false
        System.out.println(s4 == s5);    //false
        System.out.println(s1 == s6);    //true
    }
}
对于以字面量形式创建的 String 变量,JVM 会在编译期间就把该字面量的值“hello”放到字符串常量池中,这样 Java 启动的时候就已经加载到内存中了。而用 new String() 创建的字符串不是常量,不能在编译期就确定,所以 new String() 创建的字符串不放入常量池中,它们有自己的地址空间。

字符串常量池的特点就是有且只有一个相同的字面量。如果有其他相同的字面量,则 JVM 返回这个字面量的引用;如果没有相同的字面量,则在字符串常量池中创建这个字面量并返回它的引用。

由于 s2 指向的字面量“hello”在常量池中已经存在(s1 先于 s2),所以 JVM 返回的是这个字面量绑定的引用,即 s1==s2。

s3 中字面量的拼接其实就是“hello”,JVM 在编译期间就已经对它进行了优化,所以 s1 和 s3 也是相等的。

s4 中的 new String("lo")生成了两个对象:hel 和 new String("lo")。hel 存在于字符串常量池中,new String("lo")存在于堆中。String s4 = "hel" + new String("lo")实质上是两个对象的相加,编译器不会进行优化,相加的结果存在于堆中,而 s1 存在于字符串常量池中,当然不相等。同样,s1==s9 的原理也一样。

s4 和 s5 的结果都在堆中,不用说,肯定不相等。

存在于 .class 文件中的常量池在运行期被 JVM 装载,并且可以扩充。而 String 的 intern() 方法就是扩充常量池的一个方法。intern() 方法能使一个位于堆中的字符串在运行期间动态地加入字符串常量池(字符串常量池的内容是在程序启动的时候就已经加载好了的)。

调用 intern() 方法时,Java 会查找字符串常量池中是否有该对象对应的字面量,如果有,则返回该字面量在字符串常量池中的引用;如果没有,则复制一份该字面量到字符串常量池并返回它的引用,因此 s1==s6 输出 true。

拓展

如果有 4 个字符串常量,首先“C语言”和“中文网”生成了“新宝库”存在内存中,然后“新宝库”又和“ ” 生成了 “新宝库 ”存在内存中,这样因为 String 的“不可变”就产生了很多临时变量,这也就是为什么建议用 StringBuffer 的原因,因为 StringBuffer 是可改变的。

所有教程

优秀文章