Java中的String类介绍

Java

发布日期: 2021-01-07

更新日期: 2022-07-31

文章字数: 2.6k

阅读时长: 10 分

阅读次数:

引言：

Java中常用的与字符串相关的类有String，StringBuffer，StringBuilder。

String类

1、介绍

String是一个final类，不能再被继承。代表不可变字符序列。字符串是常量，用双引号引起来表示，它们的值在创建之后不能更改。String对象的字符内容是存储在一个**常量字符数组value[]**中的。
java源码中String类的声明

String被声明为final的，不能被继承
String实现了Serializable接口：表示字符串是支持序列化的
String实现了Comparable接口：表示String可以比较大小
String内部定义了final char[] value 用于存储字符串数据。该数组不能被重新赋值。
String代表不可变的字符序列。简称：不可变性
体现:
- 当对字符串重新赋值时，需要重写指定内存区域赋值，不能使用原有的value进行赋值。
- 当对现有的字符串进行连接操作时，也需要重新指定内存区域赋值，不能使用原有的value进行赋值。
- 当调用String的replace()方法修改指定字符或字符串时，也需要重新指定内存区域赋值，不能使用原有的value进行赋值。

@Test
public void test1() {
    String s1 = "abc";//字面量的定义方式
    String s2 = "abc";
    System.out.println(s1 == s2);//true，比较s1和s2的地址值，地址竟然相同

    s1 = "hello";//当对字符串重新赋值时，需要重新指定内存区域赋值，不能使用原有的value进行赋值。
    System.out.println(s1);//hello
    System.out.println(s2);//abc
    System.out.println(s1 == s2);//false

    System.out.println("*****************");

    String s3 = "abc";
    s3 += "def";//当对现有的字符串进行连接操作时，也需要重新指定内存区域赋值，不能使用原有的value进行赋值。
    System.out.println(s3);//abcdef
    System.out.println(s2);//abc

    System.out.println("*****************");

    String s4 = "abc";
    //当调用String的replace()方法修改指定字符或字符串时，也需要重新指定内存区域赋值，不能使用原有的value进行赋值。
    String s5 = s4.replace('a', 'm');
    System.out.println(s4);//abc
    System.out.println(s5);//mbc
}

通过字面量的方式（区别于new）给一个字符串赋值，此时的字符串值声明在JVM方法区的字符串常量池中。
字符串常量池中是不会存储相同内容的字符串的。

2、关于字符串的不同拼接操作的对比

常量与常量的拼接结果在常量池中。且常量池中不会存在相同内容的常量。
只要其中有一个是变量，结果就在堆中。

如果拼接的结果调用intern()方法，返回值就在常量池中

@Test
public void test2() {
    String s1 = "javaEE";
    String s2 = "hadoop";
    String s3 = "javaEEhadoop";

    String s4 = "javaEE" + "hadoop";
    String s5 = s1 + "hadoop";
    String s6 = "javaEE" + s2;
    String s7 = s1 + s2;

    System.out.println(s3 == s4);//true
    System.out.println(s3 == s5);//false
    System.out.println(s3 == s6);//false
    System.out.println(s3 == s7);//false
    System.out.println(s5 == s6);//false
    System.out.println(s5 == s7);//false
    System.out.println(s6 == s7);//false

    String s8 = s6.intern();//返回值得到的s8使用的是常量池中已经存在的“javaEEhadoop”
    System.out.println(s3 == s8);//true
}
@Test
public void test3(){
	String s1 = "hello";
    String s2 = "world";
    String s3 = s2 + "world";
    System.out.println(s1 == s3);//false

    final String s4 = "hello";//s4:常量
    String s5 = s4 + "world";
    System.out.println(s1 == s5);//true
}

内存解析

3、String的实例化方式

方式一：通过字面量定义的方式

方式二：通过new + 构造器的方式
面试题：String s = new String(“abc”);方式创建对象，在内存中创建了几个对象？两个：一个是堆空间中new结构，另一个是char[]对应的常量池中的数据：”abc”

@Test
public void test4() {
    //通过字面量定义的方式：此时的s1和s2的数据javaEE声明在方法区中的字符串常量池中。
    String s1 = "javaEE";
    String s2 = "javaEE";

    //通过new + 构造器的方式：此时的s3和s4保存的地址值，是数据在堆空间中开辟空间以后对应的地址值。
    String s3 = new String("javaEE");
    String s4 = new String("javaEE");

    System.out.println(s1 == s2);//true
    System.out.println(s1 == s3);//false
    System.out.println(s1 == s4);//false
    System.out.println(s3 == s4);//false
    System.out.println("***************************");

    class Person{//内部类
        String name;
        int age;
        Person(String name, int age) {
            this.name = name;
            this.age = age;
        }
    }

    Person p1 = new Person("Tom", 12);
    Person p2 = new Person("Tom", 12);
    System.out.println(p1.name.equals(p1.name));//true
    System.out.println(p1.name == p2.name);//true
}

4、String中的常用方法总结

int length()：返回字符串的长度：return value.length

char charAt(int index)：返回某索引处的字符return value[index]

boolean isEmpty()：判断是否是空字符串：return value.length == 0

String toLowerCase()：使用默认语言环境，将 String 中的所有字符转换为小写
String toUpperCase()：使用默认语言环境，将 String 中的所有字符转换为大写

转换后的值用新变量接受，调用者本身的值不变。（不可变性）

String trim()：返回字符串的副本，忽略前导空白和尾部空白，中间的空格不会忽略。

boolean equals(Object obj)：比较字符串的内容是否相同
boolean equalsIgnoreCase(String anotherString)：与equals方法类似，但忽略大小写进行比较

String concat(String str)：将指定字符串连接到此字符串的结尾。等价于用“+”

int compareTo(String anotherString)：比较两个字符串的大小

String substring(int beginIndex)：返回一个新的字符串，它是此字符串的从beginIndex开始截取到最后的一个子字符串。
String substring(int beginIndex, int endIndex) ：返回一个新字符串，它是此字符串从beginIndex开始截取到endIndex(不包含)的一个子字符串。

boolean endsWith(String suffix)：测试此字符串是否以指定的后缀结束
boolean startsWith(String prefix)：测试此字符串是否以指定的前缀开始
boolean startsWith(String prefix, int toffset)：测试此字符串从指定索引开始的子字符串是否以指定前缀开始

boolean contains(CharSequence s)：当且仅当此字符串包含指定的 char 值序列时，返回 true

int indexOf(String str)：返回指定子字符串在此字符串中第一次出现处的索引
int indexOf(String str, int fromIndex)：返回指定子字符串在此字符串中第一次出现处的索引，从指定的索引处开始向后寻找。但返回值还是相对于首字母开始，并不是从指定索引处开始
int lastIndexOf(String str)：返回指定子字符串在此字符串中最右边出现处的索引
int lastIndexOf(String str, int fromIndex)：返回指定子字符串在此字符串中最后一次出现处的索引，从指定的索引开始反向搜索

注：indexOf和lastIndexOf方法如果未找到都是返回-1
什么情况下，indexOf(str)和lastIndexOf(str)返回值相同？①：存在唯一的一个str。②：不存在str

String replace(char oldChar, char newChar)：返回一个新的字符串，它是通过用 newChar 替换此字符串中出现的所有 oldChar 得到的。
String replace(CharSequence target, CharSequence replacement)：使用指定的字面值替换序列替换此字符串所有匹配字面值目标序列的子字符串。
String replaceAll(String regex, String replacement)：使用给定replacement 替换此字符串所有匹配给定的正则表达式的子字符串。
String replaceFirst(String regex, String replacement)：使用给定的replacement 替换此字符串匹配给定的正则表达式的第一个子字符串。

boolean matches(String regex)：告知此字符串是否匹配给定的正则表达式。

String[] split(String regex)：根据给定正则表达式的匹配拆分此字符串。
String[] split(String regex, int limit)：根据匹配给定的正则表达式来拆分此字符串，最多不超过limit个，如果超过了，剩下的全部都放到最后一个元素中。

5、String与基本数据类型、包装类之间的转换

String –> 基本数据类型、包装类：
- 调用包装类的静态方法：包装类.parseXxx(str)
- Integer包装类的public static int parseInt(String s)：可以将由“数字”字符组成的字符串转换为整型。
- 类似地，使用java.lang包中的Byte、Short、Long、Float、Double类调相应的类方法可以将由“数字”字符组成的字符串，转化为相应的基本数据类型。
基本数据类型、包装类 –> String：
- 调用String重载的valueOf(xxx)。或者直接 xxx + ""
- 调用String类的public String valueOf(int n)可将int型转换为字符串
- 相应的valueOf(byte b)、valueOf(long l)、valueOf(float f)、valueOf(double)、valueOf(boolean b)可由参数的相应类型到字符串的转换

6、String 与字符数组char[] 之间的转换

String –> char[]：调用String的toCharArray()
- public char[] toCharArray()：将字符串中的全部字符存放在一个字符数组中的方法
- public void getChars(int srcBegin, int srcEnd, char[] dst, int dstBegin)：提供了将指定索引范围内的字符串存放到数组中
char[] –> String：调用String的构造器

String 类的构造器：String(char[]) 和 String(char[]，int offset，int length) 分别用字符数组中的全部字符和部分字符创建字符串对象。

7、String 与字节数组byte[] 之间的转换

编码：String –> byte[]：字符串到字节，调用String的getBytes()
- public byte[] getBytes() ：使用平台的默认字符集将此 String 编码为byte 序列，并将结果存储到一个新的 byte 数组中。
- public byte[] getBytes(String charsetName) ：使用指定的字符集将此 String 编码到 byte 序列，并将结果存储到新的 byte 数组。
解码：byte[] –> String：字节到字符串，调用String的构造器
- String(byte[])：通过使用平台的默认字符集解码指定的 byte 数组，构造一个新的 String。
- String(byte[]，int offset，int length) ：用指定的字节数组的一部分，即从数组起始位置offset开始取length个字节构造一个字符串对象。
说明：要求解码使用的字符集必须与编码时使用的字符集一致，否则会出现乱码。

public void test() throws UnsupportedEncodingException {
    String str1 = "abc123中国";

    byte[] bytes = str1.getBytes();//使用默认的字符集，进行编码。
    System.out.println(Arrays.toString(bytes));

    byte[] gbks = str1.getBytes("gbk");//使用gbk字符集进行编码。
    System.out.println(Arrays.toString(gbks));

    System.out.println("******************");

    String str2 = new String(bytes);//使用默认的字符集，进行解码。
    System.out.println(str2);


    String str3 = new String(gbks);
    System.out.println(str3);//出现乱码。原因：编码集和解码集不一致！


    String str4 = new String(gbks, "gbk");
    System.out.println(str4);//没有出现乱码。原因：编码集和解码集一致！
}