String对象
概述
String对象是JavaScript原生提供的三个包装对象之一,用来生成字符串的包装对象实例。
var s = new String("abc");
typeof s // "object"
s.valueOf() // "abc"
上面代码生成的变量s,就是String对象的实例,类型为对象,值为原来的字符串。实际上,String对象的实例是一个类似数组的对象。
new String("abc")
// String {0: "a", 1: "b", 2: "c"}
除了用作构造函数,String还可以当作工具方法使用,将任意类型的值转为字符串。
String(true) // "true"
String(5) // "5"
上面代码将布尔值ture和数值5,分别转换为字符串。
String.fromCharCode()
String对象直接提供的方法,主要是fromCharCode()。该方法根据Unicode编码,生成一个字符串。
String.fromCharCode(104, 101, 108, 108, 111)
// "hello"
注意,该方法不支持编号大于0xFFFF的字符。
String.fromCharCode(0x20BB7)
// "ஷ"
上面代码返回字符的编号是0x0BB7,而不是0x20BB7。这种情况下,只能使用四字节的UTF-16编号,得到正确结果。
String.fromCharCode(0xD842, 0xDFB7)
// ""
实例对象的属性和方法
length属性
该属性返回字符串的长度。
"abc".length
// 3
charAt 和 charCodeAt 方法
charAt方法返回一个字符串的给定位置的字符,位置从0开始编号。
var s = new String("abc");
s.charAt(1) // "b"
s.charAt(s.length-1) // "c"
这个方法完全可以用数组下标替代。
"abc"[1] // "b"
charCodeAt方法返回给定位置字符的Unicode编码(十进制表示)。
var s = new String("abc");
s.charCodeAt(1)
// 98
需要注意的是,charCodeAt方法返回的Unicode编码不大于65536(0xFFFF),也就是说,只返回两个字节。因此如果遇到Unicode大于65536的字符(根据UTF-16的编码规则,第一个字节在U+D800到U+DBFF之间),就必需连续使用两次charCodeAt,不仅读入charCodeAt(i),还要读入charCodeAt(i+1),将两个16字节放在一起,才能得到准确的字符。
如果给定位置为负数,或大于等于字符串的长度,则这两个方法返回NaN。
concat方法
concat方法用于连接两个字符串。
var s1 = "abc";
var s2 = "def";
s1.concat(s2) // "abcdef"
s1 // "abc"
使用该方法后,原字符串不受影响,返回一个新字符串。
该方法可以接受多个字符串。
"a".concat("b","c")
// "abc"
但是,一般来说,字符串连接运算还是应该使用加号(+)运算符。
substring方法,substr方法和slice方法
这三个方法都用来返回一个字符串的子串,而不会改变原字符串。它们都可以接受一个或两个参数,区别只是参数含义的不同。
(1)substring方法
substring方法的第一个参数表示子字符串的开始位置,第二个位置表示结束结果。因此,第二个参数应该大于第一个参数。如果出现第一个参数大于第二个参数的情况,substring方法会自动更换两个参数的位置。
var a = 'The Three Musketeers';
a.substring(4, 9) // 'Three'
a.substring(9, 4) // 'Three'
上面代码中,调换substring方法的两个参数,都得到同样的结果。
(2)substr方法
substr方法的第一个参数是子字符串的开始位置,第二个参数是子字符串的长度。
var b = 'The Three Musketeers';
b.substr(4, 9) // 'Three Mus'
b.substr(9, 4) // ' Mus'
(3)slice方法
slice方法的第一个参数是子字符串的开始位置,第二个参数是子字符串的结束位置。与substring方法不同的是,如果第一个参数大于第二个参数,slice方法并不会自动调换参数位置,而是返回一个空字符串。
var c = 'The Three Musketeers';
c.slice(4, 9) // 'Three'
c.slice(9, 4) // ''
(4)总结:第一个参数的含义
对这三个方法来说,第一个参数都是子字符串的开始位置,如果省略第二个参数,则表示子字符串一直持续到原字符串结束。
"Hello World".slice(3)
// "lo World"
"Hello World".substr(3)
// "lo World"
"Hello World".substring(3)
// "lo World"
(5)总结:第二个参数的含义
如果提供第二个参数,对于slice和substring方法,表示子字符串的结束位置;对于substr,表示子字符串的长度。
"Hello World".slice(3,7)
// "lo W"
"Hello World".substring(3,7)
// "lo W"
"Hello World".substr(3,7)
// "lo Worl"
(6)总结:负的参数
如果参数为负,对于slice方法,表示字符位置从尾部开始计算。
"Hello World".slice(-3)
// "rld"
"Hello World".slice(4,-3)
// "o Wo"
对于substring方法,会自动将负数转为0。
"Hello World".substring(-3)
// "Hello World"
"Hello World".substring(4,-3)
// "Hell"
对于substr方法,负数出现在第一个参数,表示从尾部开始计算的字符位置;负数出现在第二个参数,将被转为0。
"Hello World".substr(-3)
// "rld"
"Hello World".substr(4,-3)
// ""
indexOf 和 lastIndexOf 方法
这两个方法用于确定一个字符串在另一个字符串中的位置,如果返回-1,就表示不匹配。两者的区别在于,indexOf从字符串头部开始匹配,lastIndexOf从尾部开始匹配。
"hello world".indexOf("o")
// 4
"hello world".lastIndexOf("o")
// 7
它们还可以接受第二个参数,对于indexOf,表示从该位置开始向后匹配;对于lastIndexOf,表示从该位置起向前匹配。
"hello world".indexOf("o", 6)
// 7
"hello world".lastIndexOf("o", 6)
// 4
trim 方法
该方法用于去除字符串两端的空格。
" hello world ".trim()
// "hello world"
该方法返回一个新字符串,不改变原字符串。
toLowerCase 和 toUpperCase 方法
toLowerCase用于将一个字符串转为小写,toUpperCase则是转为大写。
"Hello World".toLowerCase()
// "hello world"
"Hello World".toUpperCase()
// "HELLO WORLD"
localeCompare方法
该方法用于比较两个字符串。它返回一个数字,如果小于0,表示第一个字符串小于第二个字符串;如果等于0,表示两者相等;如果大于0,表示第一个字符串大于第二个字符串。
'apple'.localeCompare('banana')
// -1
'apple'.localeCompare('apple')
// 0
搜索和替换
与搜索和替换相关的有4个方法,它们都允许使用正则表达式。
- match:用于确定原字符串是否匹配某个子字符串,返回匹配的子字符串数组。
- search:等同于match,但是返回值不一样。
- replace:用于替换匹配的字符串。
- split:将字符串按照给定规则分割,返回一个由分割出来的各部分组成的新数组。
下面是这4个方法的简单介绍。它们都可以使用正则对象,涉及正则对象的部分见《Regex对象》一节。
(1)match方法
match方法返回一个数组,成员为匹配的第一个字符串。如果没有找到匹配,则返回null。返回数组还有index属性和input属性,分别表示匹配字符串开始的位置(从0开始)和原始字符串。
var matches = "cat, bat, sat, fat".match("at");
matches // ["at"]
matches.index // 1
matches.input // "cat, bat, sat, fat"
(2)search方法
search方法的用法等同于match,但是返回值为匹配的第一个位置。如果没有找到匹配,则返回-1。
"cat, bat, sat, fat".search("at")
// 1
(3)replace方法
replace方法用于替换匹配的子字符串,一般情况下只替换第一个匹配(除非使用带有g修饰符的正则表达式)。
"aaa".replace("a", "b")
// "baa"
(4)split方法
split方法按照给定规则分割字符串,返回一个由分割出来的各部分组成的新数组。
"a|b|c".split("|")
// ["a", "b", "c"]
如果分割规则为空字符串,则返回数组的成员是原字符串的每一个字符。
"a|b|c".split("")
// ["a", "|", "b", "|", "c"]
如果省略分割规则,则返回数组的唯一成员就是原字符串。
"a|b|c".split()
// ["a|b|c"]
如果满足分割规则的两个部分紧邻着(即中间没有其他字符),则返回数组之中会有一个空字符串。
"a||c".split("|")
// ["a", "", "c"]
如果满足分割规则的部分处于字符串的开头或结尾(即它的前面或后面没有其他字符),则返回数组的第一个或最后一个成员是一个空字符串。
"|b|c".split("|")
// ["", "b", "c"]
"a|b|".split("|")
// ["a", "b", ""]
split方法还可以接受第二个参数,限定返回数组的最大成员数。
"a|b|c".split("|", 0) // []
"a|b|c".split("|", 1) // ["a"]
"a|b|c".split("|", 2) // ["a", "b"]
"a|b|c".split("|", 3) // ["a", "b", "c"]
"a|b|c".split("|", 4) // ["a", "b", "c"]
参考链接
- Ariya Hidayat, JavaScript String: substring, substr, slice