最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 科技 - 知识百科 - 正文

python字符编码文件方法介绍

来源:动视网 责编:小采 时间:2020-11-27 14:15:15
文档

python字符编码文件方法介绍

python字符编码文件方法介绍:字符编码发展ASCII 255 只支持英文字母和数字,特殊字符 1bytesUnicode 中文和英文 统一2bytesutf-8 中文>3bytes 英文>1bytes bytes类型文本数据总是unicode由str类型表示,二进制数据则由bytes类型表示二进制数据用在视频,音频文件以及发送soc
推荐度:
导读python字符编码文件方法介绍:字符编码发展ASCII 255 只支持英文字母和数字,特殊字符 1bytesUnicode 中文和英文 统一2bytesutf-8 中文>3bytes 英文>1bytes bytes类型文本数据总是unicode由str类型表示,二进制数据则由bytes类型表示二进制数据用在视频,音频文件以及发送soc
 字符编码发展

ASCII 255 只支持英文字母和数字,特殊字符 1bytes

Unicode 中文和英文 统一2bytes

utf-8 中文>3bytes 英文>1bytes

bytes类型

文本数据总是unicode由str类型表示,二进制数据则由bytes类型表示

二进制数据用在视频,音频文件以及发送socket网络传输数据等

字符串转成二进制 str.encode("encoding=utf-8")

二进制转成字符串 b'\xe2\x82'.decode("encoding=utf-8")

文件句柄 就是 文件对象的内存地址

字符编码和转码

ASCII码表中不能存中文,windows默认的系统字符编码是GBK.

Unicode 字符编码能存储世界上所有的字符,但所有字符都占用了两个字节,原来一个2M

的英文文件使用Unicode后需要占用4M的存储空间

utf-8字符串转换成gbk字符

任何两种编码的字符串进行转换都必须通过先转成Unicode编码来实现

Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码.

乱码的出现基本上就两种情况:

1、字符编码没有

2、字符编码冲突了,人家在写这个程序的时候指定的字符集和咱们使用的字符集的位置不对

在2.x版本的Python中Pyton在解释.py文件的时候,默认是给他一个编码的就是ASCII码

Python3中默认就是Unicode编码

因为在python2.X中默认是ASCII编码,你在文件中指定编码为UTF-8,但是UTF-8如果你想转GBK的话是不能直接转的,的需要Unicode做一个转接站点。

str ="你好" //这个字符串采用utf-8编码

new_str=str.decode('utf-8') //把str原来的编码格式传递到decode函数转码成Unicode编码

ret = new_str.encode('GBK') //把unicode编码转换成GBK编码字符串

str= u"你好" 在字符串前面加个u字母表示此字符串设置成Unicode编码

编码

python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill)所以如果不指定编码类型,

如果有中文就会报错。

Python的工作过程

python 把代码读到内存 2、词法语法分析 3、放到编译器 ---》 生成字节码 4、执行字节码 ---》生成机器码 CPU执行

变量

字符串的值是不能被修改的,他在内存里是连续的,如果想改的话必须在后面预留所以不支持修改!
字符串特性,一旦修改,重新创建

文档

python字符编码文件方法介绍

python字符编码文件方法介绍:字符编码发展ASCII 255 只支持英文字母和数字,特殊字符 1bytesUnicode 中文和英文 统一2bytesutf-8 中文>3bytes 英文>1bytes bytes类型文本数据总是unicode由str类型表示,二进制数据则由bytes类型表示二进制数据用在视频,音频文件以及发送soc
推荐度:
标签: 文件 方法 介绍
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top