最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 科技 - 知识百科 - 正文

Python2.x和3.x下maketrans与translate函数使用上的不同

来源:动视网 责编:小采 时间:2020-11-27 14:39:47
文档

Python2.x和3.x下maketrans与translate函数使用上的不同

Python2.x和3.x下maketrans与translate函数使用上的不同:maketrans和translate函数是进行字符串字符编码的常用方法。本文着重点在于演示其基本用法和在不同版本下操作的差异。本文提到的2.X版本指2.6以上的版本,3.X版本指3.1以上的版本。 2.X版本把字符串基本分为两种:unicode字符串和8位字符串str,后者包
推荐度:
导读Python2.x和3.x下maketrans与translate函数使用上的不同:maketrans和translate函数是进行字符串字符编码的常用方法。本文着重点在于演示其基本用法和在不同版本下操作的差异。本文提到的2.X版本指2.6以上的版本,3.X版本指3.1以上的版本。 2.X版本把字符串基本分为两种:unicode字符串和8位字符串str,后者包


maketrans和translate函数是进行字符串字符编码的常用方法。本文着重点在于演示其基本用法和在不同版本下操作的差异。本文提到的2.X版本指2.6以上的版本,3.X版本指3.1以上的版本。
2.X版本把字符串基本分为两种:unicode字符串和8位字符串str,后者包含字节数据和我们常见的ASCII码数据;而3.X版本则重新对字符串进行了划分,分为了字节字符串bytes和文本字符串str,两者都是不可变的,所以添加了一个可变的字节字符串类型bytearray。
2.X版本中string类型和str、unicode类型大量方法是重复的,所以3.X版本不提倡使用string模块中与str重复的方法。string模块中还有很多有用的常量和方法,比如string.digits,可以在字符串编码中方便地使用。

2.X中maketrans和translate函数的签名:

 string.maketrans(from, to)

 string.translate(s, table[, deletechars])
 str.translate(table[, deletechars])
 unicode.translate(table)

3.X中maketrans和translate函数的签名:

 static str.maketrans(x[, y[, z]])
 static bytes.maketrans(from, to)
 static bytearray.maketrans(from, to)

 str.translate(map)
 bytes.translate(table[, delete])
 bytearray.translate(table[, delete])

从中可以看出,相对于2.X的string模块的maketrans方法,3.X中分别提供了三个静态方法用于创建映射表。
下面让我们看一个简单的例子来说明字符串转换的过程:
2.X下的演示过程:

 >>> import string #导入string模块
 >>> map = string.maketrans('123', 'abc') #建立映射表,将字符串中含有的'1','2','3'替换为'a','b','c'
 >>> s = '54321123789' #转换前的字符串
 >>> s.translate(map) #用创建的映射表map转换字符串
 '54cbaabc789' #转换后的字符串

3.X下的演示过程:

 >>> map = str.maketrans('123','abc')
 >>> s = '54321123789'
 >>> s.translate(map)
 '54cbaabc789'

2.X使用了string的maketrans函数,而3.X使用了str的maketrans函数,除了这一点,使用方法是基本相同的。若指定字符串中要删除的字符时,使用就会略有不同,如下:
2.X下的演示过程:

 >>> import string
 >>> map = string.maketrans('123', 'abc')
 >>> s = '54321123789'
 >>> s.translate(map, '78') #除了转换,还要删除字符串中的字符'7','8'
 '54cbaabc9' #转换后的字符串没有字符'7','8'

3.X下的演示过程:

 >>> map = str.maketrans('123','abc', '78')#要删除的字符需要在这指定
 >>> s = '54321123789'
 >>> s.translate(map)
 '54cbaabc9'

我在读《Python Cookbook》遇到了一个基于2.X版本的例子,如下

 import string
 def translator(frm='', to='', delete='', keep=None):
 if len(to) == 1:
 to = to * len(frm)
 trans = string.maketrans(frm, to)
 if keep is not None:
 allchars = string.maketrans('', '')
 delete = allchars.translate(allchars, keep.translate(allchars,delete))
 def translate(s):
 return s.translate(trans, delete)
 return translate

allchars应该是一个返回的映射表,为什么还可以调用translate方法,所以它应该是一个str类型,测试如下:

 >>> import string
 >>> map = string.maketrans('123', 'abc')
 >>> type(map)
 

在3.X版本中这个方法不能正常通过运行,那么错在什么地方呢,我们看看映射表是什么类型:

 >>> map = str.maketrans('123','abc')
 >>> type(map)
 

知道了映射表的类型了,我们就可以对其进行“后期加工”,像上面《Python Cookbook》中的例子一样,来满足我们的编码要求。

上面讨论的例子用的字符串是ASCII字符组成的,如果是字节类型,2.X版本中操作是一样的,3.X中调用bytes或bytearray的函数;若是unicode类型的,2.X需要用unicode的translate方法,注意下面的代码

 >>> print u"hallo".translate({97:u'e'})
 hello
 >>> print u"hallo".translate({'a':u'e'})
 hallo
 >>> print u"hallo".translate({u'a':u'e'})
 hallo

结果之所以不一样,查阅手册可知unicode的translate方法的映射表也就是字典的键必须是unicode的位序数,值可以是unicode的位序数、unicode字符串或这None。

文档

Python2.x和3.x下maketrans与translate函数使用上的不同

Python2.x和3.x下maketrans与translate函数使用上的不同:maketrans和translate函数是进行字符串字符编码的常用方法。本文着重点在于演示其基本用法和在不同版本下操作的差异。本文提到的2.X版本指2.6以上的版本,3.X版本指3.1以上的版本。 2.X版本把字符串基本分为两种:unicode字符串和8位字符串str,后者包
推荐度:
标签: python translate 2.x
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top