Python之编码
一、Python2与Python3的区别
1、从宏观上考虑,Python2重复代码太多,错误率高,不够规范。Python崇尚的是语言简洁、优美、清晰。Python3更加规范,重复代码少;
2、Python2默认的编码是ASCII码,无法正确识别中文,而Python3默认的代码是utf-8,能够正确识别中文;
3、Python2中print打印时后面可以不用加(),但是Python3中print打印时必须加上(),否则会报错;
4、Python2中有range和xrange(生成器),但是Python3中只有range ;
5、Python3中的input,在Python2中是raw_input。
二、“=”、“==”与“is”的区别
1、“=” :赋值 把后面的值赋给前面
2、“==” :比较前后的值是否相等
3、“is” :比较的是前后的变量内存地址
4、id : 显示的是内存地址
li1 = [1,2,3]
li2 = li1
li3 = li2
print(id(li1),id(li2))
三、数字和字符串
小数据池:在一定范围内当多个变量被赋值的是一个相同的数值时,其占用的内存地址是一样的。
int里面有小数据概念,范围是-5------- 256
i1 = 6
i2 = 6
print(id(i1),id(i2))
i1 = 300
i2 = 300
print(id(i1),id(i2))
字符串也有小数据池概念,不过没有什么具体准确的标准,暂时只发现两个规律 1、不能含有特殊字符;
2、s*20 还是同一个地址,s*21以后都是两个地址
剩下的list、dict、tuple、set都没有小数据池概念。
四、编码
ASCII码:一个字符用8位来表示,共1个字节;
unicode码:有16位和32位的两种,现在大部分用的是32位来表示一个字符,共4个字节;
utf-8码:最少用8位来表示一个字符,英文时是8位来表示的,共1个字节,中文是用24位来表示的,共3个字节,欧洲其他国家文字是用16未来表示的,共2个字节。
gbk码:表示英文时是用8位来表示的,共1个字节,中文是用16位来表示的,共2个字节。
注意:
1、各个编码之间的二进制是不能互相识别的,会产生乱码;
2、文件的储存、传输不能是unicode(只能是utf-8、utf-16、gbk、gb2312,ascii等)
Python3中 str 在内存中是用unicode编码。
encode 编码,如何将str --> bytes, ()
s11 = s1.encode('utf-8')
s11 = s1.encode('gbk')
print(s11)
s2 = '中国'
s22 = s2.encode('utf-8')
s22 = s2.encode('gbk')
print(s22)
bytes类型
对于英文:
str :表现形式:s = 'alex' 编码方式: 010101010 unicode
bytes :表现形式:s = b'alex' 编码方式: 000101010 utf-8 gbk。。。。
对于中文:
str :表现形式:s = '中国' 编码方式: 010101010 unicode
bytes :表现形式:s = b'xe91e91e01e21e31e32' 编码方式: 000101010 utf-8 gbk。。。。
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法