String对象

概述

String对象是JavaScript原生提供的三个包装对象之一,用来生成字符串的包装对象实例。


var s = new String("abc");

typeof s // "object"
s.valueOf() // "abc"

上面代码生成的变量s,就是String对象的实例,类型为对象,值为原来的字符串。实际上,String对象的实例是一个类似数组的对象。


new String("abc")
// String {0: "a", 1: "b", 2: "c"}

除了用作构造函数,String还可以当作工具方法使用,将任意类型的值转为字符串。


String(true) // "true"
String(5) // "5"

上面代码将布尔值ture和数值5,分别转换为字符串。

String.fromCharCode()

String对象直接提供的方法,主要是fromCharCode()。该方法根据Unicode编码,生成一个字符串。


String.fromCharCode(104, 101, 108, 108, 111)
// "hello"

注意,该方法不支持编号大于0xFFFF的字符。


String.fromCharCode(0x20BB7)
// "ஷ"

上面代码返回字符的编号是0x0BB7,而不是0x20BB7。这种情况下,只能使用四字节的UTF-16编号,得到正确结果。


String.fromCharCode(0xD842, 0xDFB7)
// "𐮷"

实例对象的属性和方法

length属性

该属性返回字符串的长度。


"abc".length
// 3

charAt 和 charCodeAt 方法

charAt方法返回一个字符串的给定位置的字符,位置从0开始编号。


var s = new String("abc");

s.charAt(1) // "b"
s.charAt(s.length-1) // "c"

这个方法完全可以用数组下标替代。


"abc"[1] // "b"

charCodeAt方法返回给定位置字符的Unicode编码(十进制表示)。


var s = new String("abc");

s.charCodeAt(1)
// 98

需要注意的是,charCodeAt方法返回的Unicode编码不大于65536(0xFFFF),也就是说,只返回两个字节。因此如果遇到Unicode大于65536的字符(根据UTF-16的编码规则,第一个字节在U+D800到U+DBFF之间),就必需连续使用两次charCodeAt,不仅读入charCodeAt(i),还要读入charCodeAt(i+1),将两个16字节放在一起,才能得到准确的字符。

如果给定位置为负数,或大于等于字符串的长度,则这两个方法返回NaN。

concat方法

concat方法用于连接两个字符串。


var s1 = "abc";
var s2 = "def";

s1.concat(s2) // "abcdef"
s1 // "abc"

使用该方法后,原字符串不受影响,返回一个新字符串。

该方法可以接受多个字符串。


"a".concat("b","c")
// "abc"

但是,一般来说,字符串连接运算还是应该使用加号(+)运算符。

substring方法,substr方法和slice方法

这三个方法都用来返回一个字符串的子串,而不会改变原字符串。它们都可以接受一个或两个参数,区别只是参数含义的不同。

(1)substring方法

substring方法的第一个参数表示子字符串的开始位置,第二个位置表示结束结果。因此,第二个参数应该大于第一个参数。如果出现第一个参数大于第二个参数的情况,substring方法会自动更换两个参数的位置。


var a = 'The Three Musketeers';
a.substring(4, 9) // 'Three'
a.substring(9, 4) // 'Three'

上面代码中,调换substring方法的两个参数,都得到同样的结果。

(2)substr方法

substr方法的第一个参数是子字符串的开始位置,第二个参数是子字符串的长度。


var b = 'The Three Musketeers';
b.substr(4, 9) // 'Three Mus'
b.substr(9, 4) // ' Mus'

(3)slice方法

slice方法的第一个参数是子字符串的开始位置,第二个参数是子字符串的结束位置。与substring方法不同的是,如果第一个参数大于第二个参数,slice方法并不会自动调换参数位置,而是返回一个空字符串。


var c = 'The Three Musketeers';
c.slice(4, 9) // 'Three'
c.slice(9, 4) // ''

(4)总结:第一个参数的含义

对这三个方法来说,第一个参数都是子字符串的开始位置,如果省略第二个参数,则表示子字符串一直持续到原字符串结束。


"Hello World".slice(3)
// "lo World"

"Hello World".substr(3)
// "lo World"

"Hello World".substring(3)
// "lo World"

(5)总结:第二个参数的含义

如果提供第二个参数,对于slice和substring方法,表示子字符串的结束位置;对于substr,表示子字符串的长度。


"Hello World".slice(3,7)
// "lo W"

"Hello World".substring(3,7)
// "lo W"

"Hello World".substr(3,7)
// "lo Worl"

(6)总结:负的参数

如果参数为负,对于slice方法,表示字符位置从尾部开始计算。


"Hello World".slice(-3)
// "rld"

"Hello World".slice(4,-3)
// "o Wo"

对于substring方法,会自动将负数转为0。


"Hello World".substring(-3)
// "Hello World"

"Hello World".substring(4,-3)
// "Hell"

对于substr方法,负数出现在第一个参数,表示从尾部开始计算的字符位置;负数出现在第二个参数,将被转为0。


"Hello World".substr(-3)
// "rld"

"Hello World".substr(4,-3)
// ""

indexOf 和 lastIndexOf 方法

这两个方法用于确定一个字符串在另一个字符串中的位置,如果返回-1,就表示不匹配。两者的区别在于,indexOf从字符串头部开始匹配,lastIndexOf从尾部开始匹配。


"hello world".indexOf("o")
// 4

"hello world".lastIndexOf("o")
// 7

它们还可以接受第二个参数,对于indexOf,表示从该位置开始向后匹配;对于lastIndexOf,表示从该位置起向前匹配。


"hello world".indexOf("o", 6)
// 7

"hello world".lastIndexOf("o", 6)
// 4

trim 方法

该方法用于去除字符串两端的空格。


"  hello world  ".trim()
// "hello world"

该方法返回一个新字符串,不改变原字符串。

toLowerCase 和 toUpperCase 方法

toLowerCase用于将一个字符串转为小写,toUpperCase则是转为大写。


"Hello World".toLowerCase()
// "hello world"

"Hello World".toUpperCase()
// "HELLO WORLD"

localeCompare方法

该方法用于比较两个字符串。它返回一个数字,如果小于0,表示第一个字符串小于第二个字符串;如果等于0,表示两者相等;如果大于0,表示第一个字符串大于第二个字符串。


'apple'.localeCompare('banana')
// -1

'apple'.localeCompare('apple')
// 0

搜索和替换

与搜索和替换相关的有4个方法,它们都允许使用正则表达式。

  • match:用于确定原字符串是否匹配某个子字符串,返回匹配的子字符串数组。
  • search:等同于match,但是返回值不一样。
  • replace:用于替换匹配的字符串。
  • split:将字符串按照给定规则分割,返回一个由分割出来的各部分组成的新数组。

下面是这4个方法的简单介绍。它们都可以使用正则对象,涉及正则对象的部分见《Regex对象》一节。

(1)match方法

match方法返回一个数组,成员为匹配的第一个字符串。如果没有找到匹配,则返回null。返回数组还有index属性和input属性,分别表示匹配字符串开始的位置(从0开始)和原始字符串。


var matches = "cat, bat, sat, fat".match("at");

matches // ["at"]
matches.index // 1
matches.input // "cat, bat, sat, fat"

(2)search方法

search方法的用法等同于match,但是返回值为匹配的第一个位置。如果没有找到匹配,则返回-1。


"cat, bat, sat, fat".search("at")
// 1

(3)replace方法

replace方法用于替换匹配的子字符串,一般情况下只替换第一个匹配(除非使用带有g修饰符的正则表达式)。


"aaa".replace("a", "b")
// "baa"

(4)split方法

split方法按照给定规则分割字符串,返回一个由分割出来的各部分组成的新数组。


"a|b|c".split("|")
// ["a", "b", "c"]

如果分割规则为空字符串,则返回数组的成员是原字符串的每一个字符。


"a|b|c".split("")
// ["a", "|", "b", "|", "c"]

如果省略分割规则,则返回数组的唯一成员就是原字符串。


"a|b|c".split()
// ["a|b|c"]

如果满足分割规则的两个部分紧邻着(即中间没有其他字符),则返回数组之中会有一个空字符串。


"a||c".split("|")
// ["a", "", "c"]

如果满足分割规则的部分处于字符串的开头或结尾(即它的前面或后面没有其他字符),则返回数组的第一个或最后一个成员是一个空字符串。


"|b|c".split("|")
// ["", "b", "c"]

"a|b|".split("|")
// ["a", "b", ""]

split方法还可以接受第二个参数,限定返回数组的最大成员数。


"a|b|c".split("|", 0) // []
"a|b|c".split("|", 1) // ["a"]
"a|b|c".split("|", 2) // ["a", "b"]
"a|b|c".split("|", 3) // ["a", "b", "c"]
"a|b|c".split("|", 4) // ["a", "b", "c"]

参考链接