阅读 88

String的实现方式以及包含的重要方法

实现方式

以主流的 JDK 版本 1.8 来说,String 内部实际存储结构为 char 数组,源码如下:

public final class String implements java.io.Serializable,Comparable<String>,CharSequence{     //用于存储字符串的值     private final charvalue[];     //缓存字符串的 hash code     private int hash; //Default to 0     //......其他内容 } 复制代码

Stirng中的几个重要方法

1.多构造方法

String字符串中4个重要的构造方法:

// String 为参数的构造方法 public String(String original) {         this.value = original.value;         this.hash = original.hash;     } // char[] 为参数的构造方法 public String(char value[]) {         this.value = Arrays.copyOf(value, value.length);     } // StringBuffer 为参数的构造方法   public String(StringBuffer buffer) {         synchronized(buffer) {             this.value = Arrays.copyOf(buffer.getValue(), buffer.length());         }     } // StringBuilder 为参数的构造方法 public String(StringBuilder builder) {         this.value = Arrays.copyOf(builder.getValue(), builder.length());     } 复制代码

2.equals()比较两个字符串是否相等

源码如下:

public boolean equals(Object anObject) {     // 对象引用相同直接返回true     if (this == anObject) {         return true;     }     // 判断需要对比的值是否为 String 类型,如果不是则直接返回 false     if (anObject instanceof String) {         String anotherString = (String)anObject;         int n = value.length;         if (n == anotherString.value.length) {             // 把两个字符串转化为 char 数组对比             char v1[] = value;             char v2[] = anotherString.value;             int i = 0;             // 循环比对两个字符串的每一字符             while (n-- != 0) {                 // 如果其中一个字符不相等就返回false 若相等就继续比对                 if (v1[i] != v2[i])                     return false;                 i++;             }             return true;         }     }     return false; } 复制代码

String类型重写了Object中的equals()方法,equals()方法需要传递一个Object类型的参数值,在比较时会先通过instanceof判断是否为String类型,如果不是则会直接返回falseinstanceof的使用如下:

Object oString ="123"; Object oInt =123; System.out.println(oString instanceof String);//返回 true  System.out.println(oInt instanceof String);//返回false 复制代码

当判断参数为String类型之后,会循环对比两个字符串中的每一个字符,当所有字符都相等时返回true,否则则返回false。还有一个和equals()比较类似的方法equalslgnoreCase(),它是用于忽略字符串的大小写之后进行字符串对比。

3.compareTo()比较两个字符串

compareTo() 方法用于比较两个字符串,返回的结果为 int 类型的值,源码如下:

public int compareTo(String anotherString) {         int len1 = value.length;         int len2 = anotherString.value.length;         // 获取两个字符串长度最短的那个 int 值         int lim = Math.min(len1, len2);         char v1[] = value;         char v2[] = anotherString.value;          int k = 0;         // 对比每个字符串         while (k < lim) {             char c1 = v1[k];             char c2 = v2[k];             if (c1 != c2) {                 // 有字符不相等就返回差值                 return c1 - c2;             }             k++;         }         return len1 - len2;     } 复制代码

从源码中可以看出,compareTo()方法会循环对比所有的字符,当两个字符串中有任意一个字符不相同时,则return char1-char2。比如,两个字符串分别存储的是1和2,返回的值是-1;如果存储的是1和1,则返回的值是0,如果存储的是2和1,则返回的值是1。还有一个和compareTo()比较类似的方法 compareTolgnoreCase(),用于忽略大小写后比较两个字符串。可以看出compareTo()方法和equals()方法都是用于比较两个字符串的,但它们有两点不同:

  • equals()可以接收一个Object 类型的参数,而compareTo()只能接收一个String类型的参数;

  • equals()返回值为Boolean,而compareTo()的返回值则为int

它们都可以用于两个字符串的比较,当 equals()方法返回 true时,或者是compareTo()方法返回0 时,则表示两个字符串完全相同。

4.其他重要方法

  • indexOf():查询字符串首次出现的下标的位置

  • lastIndexOf():查询字符串最后出现的下表的位置

  • contains():查询字符串中是否含有另一个字符串

  • toLowerCase():把字符串全部转化为小写

  • toUpperCase():把字符串全部转化为大写

  • length():查询字符串的长度

  • trim():去除字符串首尾的空格

  • replace():替换字符串中的某些字符

  • split():把字符串分割并返回字符串数组

  • jion():把字符串数组转化为字符串

考点分析

这道题目考察的重点是,你对 Java 源码的理解,这也从侧面反应了你是否热爱和喜欢专研程序,而这正是一个优秀程序员所必备的特质。

String 源码属于所有源码中最基础、最简单的一个,对 String 源码的理解也反应了你的 Java 基础功底。

String 问题如果再延伸一下,会问到一些更多的知识细节,这也是大厂一贯使用的面试策略,从一个知识点入手然后扩充更多的知识细节,对于 String 也不例外,通常还会关联的询问以下问题:

  • 为什么 String 类型要用 final 修饰?

  • == 和 equals 的区别是什么?

  • String 和 StringBuilder、StringBuffer 有什么区别?

  • String 的 intern() 方法有什么含义?

  • String 类型在 JVM(Java 虚拟机)中是如何存储的?编译器对 String 做了哪些优化?

String的扩展问题

1.==和equals的区别

==对于基本数据类型来说,是用于比较“值"是否相等的;而对于引用类型来说,是用于比较引用地址是否相同的。查看源码我们可以知道Object中也有equals()方法,源码如下:

public boolean equals(Object obj) {     return (this == obj); } 复制代码

可以看出,Object 中的 equals() 方法其实就是 ==,而 String 重写了 equals() 方法把它修改成比较两个字符串的值是否相等。源码如下:

public boolean equals(Object anObject) {     // 对象引用相同直接返回true     if (this == anObject) {         return true;     }     // 判断需要对比的值是否为 String 类型,如果不是则直接返回 false     if (anObject instanceof String) {         String anotherString = (String)anObject;         int n = value.length;         if (n == anotherString.value.length) {             // 把两个字符串转化为 char 数组对比             char v1[] = value;             char v2[] = anotherString.value;             int i = 0;             // 循环比对两个字符串的每一字符             while (n-- != 0) {                 // 如果其中一个字符不相等就返回false 若相等就继续比对                 if (v1[i] != v2[i])                     return false;                 i++;             }             return true;         }     }     return false; } 复制代码

2.final修饰的好处

从 String 类的源码我们可以看出 String 是被 final 修饰的不可继承类,源码如下:

public final class String implements java.io.Serializable,Comparable<String>,CharSequence{     ... } 复制代码

那这样设计有什么好处呢?

Java 语言之父James Gosling的回答是,他会更倾向于使用final,因为它能够缓存结果,当你在传参时不需要考虑谁会修

改它的值;如果是可变类的话,则有可能需要重新拷贝出来一个新值进行传参,这样在性能上就会有一定的损失。

James Gosling 还说迫使String类设计成不可变的另一个原因是安全,当你在调用其他方法时,比如调用一些系统级操作

指令之前,可能会有一系列校验,如果是可变类的话,可能在你校验过后,它的内部的值又被改变了,这样有可能会引起

严重的系统崩溃问题,这是迫使String类设计成不可变类的一个重要原因。

总结来说,使用final修饰的第一个好处是安全;第二个好处是高效,以JVM中的字符串常量池来举例,如下两个变量:

String s1 = "java"; String s2 = "java"; 复制代码

只有字符串是不可变时,我们才能实现字符串常量池,字符串常量池可以为我们缓存字符串,提高程序的运行效率,如下图所示:

试想一下如果String是可变的,那当 s1 的值修改之后,s2 的值也跟着改变了,这样就和我们预期的结果不相符了,因此也就没有办法实现字符串常量池的功能了。

3. String 和 StringBuilder、StringBuffer 的区别

因为String类型是不可变的,所以在字符串拼接的时候如果使用String的话性能会很低,因此我们就需要使用另一个数据类型StringBuffer,它提供了appendinsert方法可用于字符串的拼接,它使用synchronized来保证线程安全,如下源码所示:

    @Override     public synchronized StringBuffer append(Object obj) {         toStringCache = null;         super.append(String.valueOf(obj));         return this;     }      @Override     public synchronized StringBuffer append(String str) {         toStringCache = null;         super.append(str);         return this;     } 复制代码

因为它使用了synchronized来保证线程安全,所以性能不是很高,于是在JDK1.5就有了StringBuilder,它同样提供了appendinsert的拼接方法,但它没有使用synchronized来修饰,因此在性能上要优于StringBuffer,所以在非并发操作的环境下可使用StringBuilder来进行字符串拼接。

4.String和JVM

String常见的创建方式有两种,直接赋值的方式"String s1="Java";""String s2=new String("Java");"的方式,但两者在JVM的存储区域却截然不同,在JDK1.8中,变量s1会先去字符串常量池中找字符串"Java”,如果有相同的字符则直接返回常量句柄,如果没有此字符串则会先在常量池中创建此字符串,然后再返回常量句柄;而变量s2是直接在堆上创建一个变量,如果调用intern方法才会把此字符串保存到常量池中,如下代码所示:

String s1 = new String("Java"); String s2 = s1.intern(); String s3 = "Java"; System.out.println(s1 == s2); // false System.out.println(s2 == s3); // true 复制代码

小贴士:JDK 1.7 之后把永生代换成的元空间,把字符串常量池从方法区移到了 Java 堆上。

除此之外编译器还会对 String 字符串做一些优化,例如以下代码:

 String s1 = "Ja" + "va"; String s2 = "Java"; System.out.println(s1 == s2); 复制代码

虽然 s1 拼接了多个字符串,但对比的结果却是 true,我们使用反编译工具,看到的结果如下:

 0 ldc #2 <Java>  2 astore_1  3 ldc #2 <Java>  5 astore_2  6 getstatic #3 <java/lang/System.out>  9 aload_1 10 aload_2 11 if_acmpne 18 (+7) 14 iconst_1 15 goto 19 (+4) 18 iconst_0 19 invokevirtual #4 <java/io/PrintStream.println> 22 return 复制代码

从编译代码 #2 可以看出,代码 "Ja"+"va" 被直接编译成了 "Java" ,因此 s1==s2 的结果才是 true,这就是编译器对字符串优化的结果。

小结

本文讲了 String 的构造方法、equals() 方法和 compareTo() 方法,其中 equals() 重写了 Object 的 equals() 方法,把引用对比改成了字符串值对比,也介绍了 final 修饰 String 的好处,可以提高效率和增强安全性,同时我们还介绍了 String 和 JVM 的一些执行细节。


作者:BigJoker
链接:https://juejin.cn/post/7028864261199757326


文章分类
代码人生
版权声明:本站是系统测试站点,无实际运营。本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 XXXXXXo@163.com 举报,一经查实,本站将立刻删除。
相关推荐