数据类型转换

JavaScript是一种动态类型语言,变量是没有类型的,可以随时赋予任意值。但是,数据本身和各种运算是有类型的,因此运算时变量需要转换类型。大多数情况下,这种数据类型转换是自动的,但是有时也需要手动强制转换。

强制转换

强制转换主要指使用Number、String和Boolean三个构造函数,手动将各种类型的值,转换成数字、字符串或者布尔值。

Number函数:强制转换成数值

使用Number函数,可以将任意类型的值转化成数字。

(1)原始类型值的转换规则

  • 数值:转换后还是原来的值。

  • 字符串:如果可以被解析为数值,则转换为相应的数值,否则得到NaN。空字符串转为0。

  • 布尔值:true转成1,false转成0。

  • undefined:转成NaN。

  • null:转成0。


Number("324") // 324

Number("324abc") // NaN

Number("") // 0

Number(false) // 0

Number(undefined) // NaN

Number(null) // 0

Number函数将字符串转为数值,要比parseInt函数严格很多。基本上,只要有一个字符无法转成数值,整个字符串就会被转为NaN。


parseInt('011') // 9
parseInt('42 cats') // 42
parseInt('0xcafebabe') // 3405691582

Number('011') // 11
Number('42 cats') // NaN
Number('0xcafebabe') // 3405691582

上面代码比较了Number函数和parseInt函数,区别主要在于parseInt逐个解析字符,而Number函数整体转换字符串的类型。另外,Number会忽略八进制的前导0,而parseInt不会。

Number函数会自动过滤一个字符串前导和后缀的空格。


Number('\t\v\r12.34\n ')

(2)对象的转换规则

对象的转换规则比较复杂。

  1. 先调用对象自身的valueOf方法,如果该方法返回原始类型的值(数值、字符串和布尔值),则直接对该值使用Number方法,不再进行后续步骤。

  2. 如果valueOf方法返回复合类型的值,再调用对象自身的toString方法,如果toString方法返回原始类型的值,则对该值使用Number方法,不再进行后续步骤。

  3. 如果toString方法返回的是复合类型的值,则报错。


Number({a:1})
// NaN

上面代码等同于


if (typeof {a:1}.valueOf() === 'object'){
    Number({a:1}.toString());
} else {
    Number({a:1}.valueOf());
}

上面代码的valueOf方法返回对象本身({a:1}),所以对toString方法的返回值“[object Object]”使用Number方法,得到NaN。

如果toString方法返回的不是原始类型的值,结果就会报错。


var obj = {
    valueOf: function () {
            console.log("valueOf");
            return {};
    },
    toString: function () {
            console.log("toString");
            return {}; 
    }
};

Number(obj)
// TypeError: Cannot convert object to primitive value

上面代码的valueOf和toString方法,返回的都是对象,所以转成数值时会报错。

从上面的例子可以看出,valueOf和toString方法,都是可以自定义的。


Number({valueOf:function (){return 2;}})
// 2

Number({toString:function(){return 3;}})
// 3

Number({valueOf:function (){return 2;},toString:function(){return 3;}})
// 2

上面代码对三个对象使用Number方法。第一个对象返回valueOf方法的值,第二个对象返回toString方法的值,第三个对象表示valueOf方法先于toString方法执行。

String函数:强制转换成字符串

使用String函数,可以将任意类型的值转化成字符串。规则如下:

(1)原始类型值的转换规则

  • 数值:转为相应的字符串。

  • 字符串:转换后还是原来的值。

  • 布尔值:true转为“true”,false转为“false”。

  • undefined:转为“undefined”。

  • null:转为“null”。


String(123) // "123"

String("abc") // "abc"

String(true) // "true"

String(undefined) // "undefined"

String(null) // "null"

(2)对象的转换规则

如果要将对象转为字符串,则是采用以下步骤。

  1. 先调用toString方法,如果toString方法返回的是原始类型的值,则对该值使用String方法,不再进行以下步骤。

  2. 如果toString方法返回的是复合类型的值,再调用valueOf方法,如果valueOf方法返回的是原始类型的值,则对该值使用String方法,不再进行以下步骤。

  3. 如果valueOf方法返回的是复合类型的值,则报错。

String方法的这种过程正好与Number方法相反。


String({a:1})
// "[object Object]"

上面代码相当于下面这样。


String({a:1}.toString())
// "[object Object]"

如果toString方法和valueOf方法,返回的都不是原始类型的值,则String方法报错。


var obj = {
    valueOf: function () {
            console.log("valueOf");
            return {}; 
    },
    toString: function () {
            console.log("toString");
            return {}; 
    }
};

String(obj)
// TypeError: Cannot convert object to primitive value

下面是一个自定义toString方法的例子。


String({toString:function(){return 3;}})
// "3"

String({valueOf:function (){return 2;}})
// "[object Object]"

String({valueOf:function (){return 2;},toString:function(){return 3;}})
// "3"

上面代码对三个对象使用String方法。第一个对象返回toString方法的值(数值3),然后对其使用String方法,得到字符串“3”;第二个对象返回的还是toString方法的值("[object Object]"),这次直接就是字符串;第三个对象表示toString方法先于valueOf方法执行。

Boolean函数:强制转换成布尔值

使用Boolean函数,可以将任意类型的变量转为布尔值。

(1)原始类型值的转换方法

以下六个值的转化结果为false,其他的值全部为true。

  • undefined
  • null
  • -0
  • +0
  • NaN
  • ''(空字符串)

Boolean(undefined) // false

Boolean(null) // false

Boolean(0) // false

Boolean(NaN) // false

Boolean('') // false

(2)对象的转换规则

所有对象的布尔值都是true,甚至连false对应的布尔对象也是true。


Boolean(new Boolean(false))
// true

请注意,空对象{}和空数组[]也会被转成true。


Boolean([]) // true

Boolean({}) // true

自动转换

当遇到以下几种情况,JavaScript会自动转换数据类型:

  • 不同类型的数据进行互相运算;

  • 对非布尔值类型的数据求布尔值;

  • 对非数值类型的数据使用一元运算符(即“+”和“-”)。

自动转换为布尔值

当JavaScript遇到预期为布尔值的地方(比如if语句的条件部分),就会将非布尔值的参数自动转换为布尔值。它的转换规则与上面的“强制转换成布尔值”的规则相同,也就是说,在预期为布尔值的地方,系统内部会自动调用Boolean方法。

因此除了以下六个值,其他都是自动转为true:

  • undefined
  • null
  • -0
  • +0
  • NaN
  • ''(空字符串)

if (!undefined && !null && !0 && !NaN && !''){
    console.log('true');
}
// true

自动转换为字符串

当JavaScript遇到预期为字符串的地方,就会将非字符串的数据自动转为字符串,转换规则与“强制转换为字符串”相同。

字符串的自动转换,主要发生在加法运算时。当一个值为字符串,另一个值为非字符串,则后者转为字符串。


'5' + 1 // '51'
'5' + true // "5true"
'5' + false // "5false"
'5' + {} // "5[object Object]"
'5' + [] // "5"
'5' + function (){} // "5function (){}"
'5' + undefined // "5undefined"
'5' + null // "5null"

自动转换为数值

当JavaScript遇到预期为数值的地方,就会将参数值自动转换为数值,转换规则与“强制转换为数值”相同。

除了加法运算符有可能把运算子转为字符串,其他运算符都会把两侧的运算子自动转成数值。


'5' - '2' // 3
'5' * '2' // 10
true - 1  // 0
false - 1 // -1
'1' - 1   // 0
'5'*[]    // 0
false/'5' // 0
'abc'-1   // NaN

上面都是二元算术运算符的例子,JavaScript的两个一元算术运算符——正号和负号——也会把运算子自动转为数值。


+'abc' // NaN
-'abc' // NaN
+true // 1
-false // 0

小结

由于自动转换有很大的不确定性,而且不易除错,建议在预期为布尔值、数值、字符串的地方,全部使用Boolean、Number和String方法进行显式转换。

加法运算符的类型转化

加法运算符(+)需要特别讨论,因为它可以完成两种运算(加法和字符连接),所以不仅涉及到数据类型的转换,还涉及到确定运算类型。

三种情况

加法运算符的类型转换,可以分成三种情况讨论。

(1)运算子之中存在字符串

两个运算子之中,只要有一个是字符串,则另一个不管是什么类型,都会被自动转为字符串,然后执行字符串连接运算。前面的《自动转换为字符串》一节,已经举了很多例子。

(2)两个运算子都为数值或布尔值

这种情况下,执行加法运算,布尔值转为数值(true为1,false为0)。


true + 5 // 6

true + true // 2

(3)运算子之中存在对象

运算子之中存在对象(或者准确地说,存在非原始类型的值),则先调用该对象的valueOf方法。如果返回结果为原始类型的值,则运用上面两条规则;否则继续调用该对象的toString方法,对其返回值运用上面两条规则。


1 + [1,2]
// "11,2"

上面代码的运行顺序是,先调用[1,2].valueOf(),结果还是数组[1,2]本身,则继续调用[1,2].toString(),结果字符串“1,2”,所以最终结果为字符串“11,2”。


1 + {a:1}
// "1[object Object]"

对象{a:1}的valueOf方法,返回的就是这个对象的本身,因此接着对它调用toString方法。({a:1}).toString()默认返回字符串"[object Object]",所以最终结果就是字符串“1[object Object]”

有趣的是,如果更换上面代码的运算次序,就会得到不同的值。


{a:1} + 1
// 1

原来此时,JavaScript引擎不将{a:1}视为对象,而是视为一个代码块,这个代码块没有返回值,所以被忽略。因此上面的代码,实际上等同于 {a:1};+1 ,所以最终结果就是1。为了避免这种情况,需要对{a:1}加上括号。


({a:1})+1
"[object Object]1"

将{a:1}放置在括号之中,由于JavaScript引擎预期括号之中是一个值,所以不把它当作代码块处理,而是当作对象处理,所以最终结果为“[object Object]1”。


1 + {valueOf:function(){return 2;}}
// 3

上面代码的valueOf方法返回数值2,所以最终结果为3。


1 + {valueOf:function(){return {};}}
// "1[object Object]"

上面代码的valueOf方法返回一个空对象,则继续调用toString方法,所以最终结果是“1[object Object]”。


1 + {valueOf:function(){return {};}, toString:function(){return 2;}}
// 3

上面代码的toString方法返回数值2(不是字符串),则最终结果就是数值3。


1 + {valueOf:function(){return {};}, toString:function(){return {};}}
// TypeError: Cannot convert object to primitive value

上面代码的toString方法返回一个空对象,JavaScript就会报错,表示无法获得原始类型的值。

四个特殊表达式

有了上面这些例子,我们再进一步来看四个特殊表达式。

(1)空数组 + 空数组


[] + []
// ""

首先,对空数组调用valueOf方法,返回的是数组本身;因此再对空数组调用toString方法,生成空字符串;所以,最终结果就是空字符串。

(2)空数组 + 空对象


[] + {}
// "[object Object]"

这等同于空字符串与字符串“[object Object]”相加。因此,结果就是“[object Object]”。

(3)空对象 + 空数组


{} + []
// 0

JavaScript引擎将空对象视为一个空的代码块,加以忽略。因此,整个表达式就变成“+ []”,等于对空数组求正值,因此结果就是0。转化过程如下:


+ []
// Number([])
// Number([].toString())
// Number("")
// 0

如果JavaScript不把前面的空对象视为代码块,则结果为字符串“[object Object]”。


({}) + []
// "[object Object]"

(4)空对象 + 空对象


{} + {}
// NaN

JavaScript同样将第一个空对象视为一个空代码块,整个表达式就变成“+ {}”。这时,后一个空对象的ValueOf方法得到本身,再调用toSting方法,得到字符串“[object Object]”,然后再将这个字符串转成数值,得到NaN。所以,最后的结果就是NaN。转化过程如下:


+ {}
// Number({})
// Number({}.toString())
// Number("[object Object]")

如果,第一个空对象不被JavaScript视为空代码块,就会得到“[object Object][object Object]”的结果。


({}) + {}
// "[object Object][object Object]"

({} + {})
// "[object Object][object Object]"    

console.log({} + {})
// "[object Object][object Object]"

var a = {} + {};
a
// "[object Object][object Object]"

需要指出的是,对于第三和第四种情况,Node.js的运行结果不同于浏览器环境。


{} + {}
// "[object Object][object Object]"

{} + []
// "[object Object]"

可以看到,Node.js没有把第一个空对象视为代码块。原因是Node.js的命令行环境,内部执行机制大概是下面的样子:


eval.call(this,"(function(){return {} + {}}).call(this)")

Node.js把命令行输入都放在eval中执行,所以不会把起首的大括号理解为空代码块加以忽略。

参考链接