Java学习笔记09(1)-常用类之String
一、String类
1、字符串的使用
String
类的特征:
String
类声明为final
的,不可以被继承。String
类实现了Serializable
接口,表示字符串是支持序列化的。String
类实现了Comparable
接口,表示字符串可以比较大小String
类内部定义了final char[] value
,用于存储字符串数据。数组不能被重新赋值,数组元素不能被修改。(JDK 9.0改为了byte
数组)String
代表不可变的字符序列,不可变性,以下操作需要重写指定内存区域进行赋值,不能使用原有的value
进行赋值:- 当对字符串重新赋值时
- 当对现有的字符串进行连接操作时
- 当调用String的replace方法修改指定的字符/字符串时
2、字符串创建和存储
字符串有两种创建方式:
- 字面量定义:比如
String s1 = "hello";
- 创建
String
类对象:比如:String s2 = new String("hello");
字面量定义的字符串存储在字符串常量池(位于方法区)中,目的是共享;通过创建对象构建的字符串存储在堆中,堆中的地址值又指向字符串常量池中的值。
字符串常量池中不会保存内容相同的字符串,每个字符串只保存一份。
通过创建String类对象构造的字符串,内存中一共创建了两个对象,一个String类对象,一个底层的数组对象。
两种方式定义的字符串,在内存中的区别:
具体案例:
1 |
|
总结:
- 常量(字面量定义的,或者final修饰的,都是常量)与常量的拼接结果在常量池。且常量池中不会存在相同内容的常量。
- 只要其中有一个是变量,结果就在堆中,地址也不同。比如
s1 + s2
、s1+"abc"
、s1+="abc"
等,用==
比较是地址,结果是false
,比如s1+"abc" == s1+"abc"
为false
- 如果拼接的结果调用
intern()
方法,返回值就在常量池中。
二、String类常用方法
String类的常用方法:
int length()
:返回字符串的长度:return value.length
char charAt(int index)
:返回某索引处的字符:return value[index]
boolean isEmpty()
:判断是否是空字符串:return value.length==0
String toLowerCase()
:使用默认语言环境,将String中的所有字符转换为小写String toUpperCase()
:使用默认语言环境,将String中的所有字符转换为大写String trim()
:返回字符串的副本,忽略前导空白和尾部空白boolean equals(Object obj)
:比较字符串的内容是否相同boolean equalsIgnoreCase(String anotherString)
:与equals方法类似,忽略大小写String concat(String str)
:将指定字符串连接到此字符串的结尾。等价于用“+”int compareTo(String anotherString)
:比较两个字符串的大小String substring(int beginIndex)
:返回一个新的字符串,它是此字符串的从beginIndex开始截取到最后的一个子字符串。String substring(int beginIndex,int endIndex)
:返回一个新字符串,它是此字符串从beginIndex开始截取到endIndex(不包含)的一个子字符串。boolean endsWith(String suffix)
:测试此字符串是否以指定的后缀结束boolean startsWith(String prefix)
:测试此字符串是否以指定的前缀开始boolean startsWith(String prefix,int toffset)
:测试此字符串从指定索引开始的子字符串是否以指定前缀开始boolean contains(CharSequence s)
:当且仅当此字符串包含指定的char值序列时,返回trueint indexOf(String str)
:返回指定子字符串在此字符串中第一次出现处的索引int indexOf(String str, int fromIndex)
:返回指定子字符串在此字符串中第一次出现处的索引,从指定的索引开始int lastIndexOf(String str)
:返回指定子字符串在此字符串中最右边出现处的索引int lastIndexOf(String str, int fromIndex)
:返回指定子字符串在此字符串中最后一次出现处的索引,从指定的索引开始反向搜索
注:
indexOf
和lastIndexOf
方法如果未找到都是返回-1
String replace(char oldChar,char newChar)
:返回一个新的字符串,它是通过用newChar替换此字符串中出现的所有oldChar得到的。String replace(CharSequence target,CharSequence replacement)
:使用指定的字面值替换序列替换此字符串所有匹配字面值目标序列的子字符串。String replaceAll(String regex,String replacement)
:使用给定的replacement替换此字符串所有匹配给定的正则表达式的子字符串。String replaceFirst(String regex,String replacement)
:使用给定的replacement替换此字符串匹配给定的正则表达式的第一个子字符串。boolean matches(String regex)
:告知此字符串是否匹配给定的正则表达式。String[] split(String regex)
:根据给定正则表达式的匹配拆分此字符串。String[] split(String regex,int limit)
:根据匹配给定的正则表达式来拆分此字符串,最多不超过limit个,如果超过了,剩下的全部都放到最后一个元素中。
三、String类与基本数据类型之间的转换
1、字符串与基本数据类型、包装类
- 字符串—>基本数据类型、包装类:
Integer
包装类的public static int parseInt(String s)
可将由“数字”字符组成的字符串转换为整型。类似地,使用java.lang
包中的Byte
、Short
、Long
、Float
、Double
类调相应的类方法可以将由“数字”字符组成的字符串,转化为相应的基本数据类型。
- 基本数据类型、包装类—>字符串:
- 调用
String
类的public String valueOf(int n)
可将int
型转换为字符串。相应的valueOf(byte b)
、valueOf(long l)
、valueOf(float f)
、valueOf(double d)
、valueOf(boolean b)
可由参数的相应类型到字符串的转换。
- 调用
2、字符串与字符数组
- 字符数组—>字符串:
String
类的构造器:String(char[])
和String(char[],int offset,int length)
分别用字符数组中的全部字符和部分字符创建字符串对象。
- 字符串—>字符数组:
public char[] toCharArray()
:将字符串中的全部字符存放在一个字符数组中。public void getChars(int srcBegin, int srcEnd, char[]dst, int dstBegin)
:提供了将指定索引范围内的字符串存放到数组中的方法。
3、字符串与字节数组
- 字节数组—>字符串:
String(byte[])
:通过使用平台的默认字符集解码指定的byte数组,构造一个新的String。String(byte[],int offset,int length)
:用指定的字节数组的一部分,即从数组起始位置offset开始取length个字节构造一个字符串对象。
- 字符串—>字节数组:
public byte[] getBytes()
:使用平台的默认字符集(编码方式)将此String编码为byte序列,并将结果存储到一个新的byte数组中。public byte[] getBytes(String charsetName)
:使用指定的字符集将此String编码到byte序列,并将结果存储到新的byte数组。
字节数组转换为字符串的过程,就是解码的过程,反之,字符串变为字节数组是编码的过程。
编码和解码默认使用平台默认字符集。
编码和解码使用的字符集(比如都是UTF-8)应该相同,否则出现乱码。
四、StringBuffer和StringBuilder
StringBuffer
和StringBuilder
都是可变的字符序列,对字符串修改,不会产生新的对象,直接在原来的字符串对象上进行修改。
String
、StringBuffer
、StringBuilder
的异同:
String
: 1.0 ,不可变的字符序列;底层使用char[]来保存StringBuffer
:1.0 ,可变的字符序列;线程安全的,效率低;底层使用char[]来保存StringBuilder
:JDK 5.0新增 ,可变的字符序列;线程不安全,效率高;底层使用char[]来保存
JDK9.0之后,三者的底层存储结构都改为了byte[]数组
效率从高到低排列:
StringBuilder
>StringBuffer
>String
StringBuffer
和StringBuilder
在使用方法上类似,提供的方法也相同。这里以StringBuffer
为例,讲解其扩容机制以及常用的方法。
1、构造StringBuffer/StringBuilder对象
StringBuffer
类不同于String
,其对象必须使用构造器生成。有三个构造器:
StringBuffer()
:初始容量为16的字符串缓冲区。StringBuffer(intsize)
:构造指定容量的字符串缓冲区。StringBuffer(String str)
:将内容初始化为指定字符串内容。
举例:
1 |
|
String
、StringBuffer
、StringBuilder
三者之间的相互转换:
String
—>StringBuffer
、StringBuilder
,直接调用两者的构造器:StringBuffer sb = new StringBuffer(str);
StringBuffer
、StringBuilder
—>String
:- 调用两者的
toString()
方法 - 调用
String
的构造器。String str = new String(sb);
- 调用两者的
2、扩容机制
对于StringBuffer
和StringBuilder
来说,如果添加的数据,底层数组装不下,就需要扩容底层的数组。
默认情况下,扩容为原来容量的2倍+2(JDK 7.0 ,不同JDK版本可能不同),同时将原有数组中的元素复制到新的数组中。
关于为什么+2,各种解释:
1、考虑到在创建Sf,Sb设置的初始长度不大时(例如1),+2 可以很大地提升扩容的效率,减少扩容的次数
2、在旧版本的JDK扩容语句是 (value.length + 1) * 2 先加一再乘2,推测原意思是扩容的话至少增添一个空间再乘2,兼顾到扩容的次数和要减少扩容过大浪费的空间
3、newCapacity(int)的传入参数有可能是0,那么在参数是0的情况下,0<<1运算结果也是0,如果没+2,那么在创建数组的时候会创建出MAX_ARRAY_SIZE大小,所以作为设计的安全性考虑,选择了+2。
4、在使用StringBuffer的时候,append()之后,我们一般会在后面在加上一个分隔符,例如逗号,也就是再加上一个char,而char在java中占2个字节,避免了因为添加分隔符而再次引起扩容
举例:
1 |
|
为了提高效率,建议使用
StringBuffer(int capacity)
或StringBuilder(int capacity)
指定初始容量,尽量避免自动扩容。
3、常用方法
String Buffer append(xxx)
:提供了很多的append()方法,用于进行字符串拼接。如果参数是null,会被当成字符串添加进去String Buffer delete(int start,int end)
:删除指定位置的内容String Buffer replace(int start,int end,String str)
:把[start,end)位置替换为strString Buffer insert(int offset,xxx)
:在指定位置插入xxxString Buffer reverse()
:把当前字符序列逆转public int indexOf(String str)
public String substring(int start,int end)
public int length()
public char charAt(int n )
public void setCharAt(int n ,char ch)
- 本文作者:Kangshitao
- 本文链接:http://kangshitao.github.io/2021/04/03/java-note-0901/index.html
- 版权声明:本博客所有文章均采用 BY-NC-SA 许可协议,转载请注明出处!