最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 科技 - 知识百科 - 正文

Python正则表达式匹配中文用法示例

来源:动视网 责编:小采 时间:2020-11-27 14:16:41
文档

Python正则表达式匹配中文用法示例

Python正则表达式匹配中文用法示例:本文实例讲述了Python正则表达式匹配中文用法。分享给大家供大家参考,具体如下:#!/usr/bin/python #-*- coding:cp936-*-#思路,将str转换成unicode,方可用正则表达式,前提是,要知道文件的编码,本例中是gbk import cPickle as m
推荐度:
导读Python正则表达式匹配中文用法示例:本文实例讲述了Python正则表达式匹配中文用法。分享给大家供大家参考,具体如下:#!/usr/bin/python #-*- coding:cp936-*-#思路,将str转换成unicode,方可用正则表达式,前提是,要知道文件的编码,本例中是gbk import cPickle as m
 本文实例讲述了Python正则表达式匹配中文用法。分享给大家供大家参考,具体如下:

#!/usr/bin/python
#-*- coding:cp936-*-#思路,将str转换成unicode,方可用正则表达式,前提是,要知道文件的编码,本例中是gbk
import cPickle as mypickle
import re
import sys
if (__name__=='__main__'):
 fid1=file('demo.txt','r');#demo.txt写入字符如:脚本之家
 p=re.compile('(^s+|s+$)');
 phanzigbk=re.compile('[\x20-\x7f]');
 phanzi=re.compile(u'[u4e00-u9fa5]');#这里要加u,注意
 commlines=fid1.readlines();
 fid1.close();
 dictfamilyname={};
 dictfirstname={};
 for line in commlines:
 line=p.sub('',line);
 print type(line);
 print line;
 uline=unicode(line,'gbk');
 print type(uline);
 candidates=phanzi.findall(uline);
 print len(candidates);
 if(len(candidates)==2):
 print candidates[0];
 familynamegbk=candidates[0].encode('gbk');#把unicode型的变量变成str型的变量
 firstnamegbk=candidates[1].encode('gbk');
 if(dictfamilyname.has_key(familynamegbk)):
 dictfamilyname[familynamegbk]=dictfamilyname[familynamegbk]+1;
 else:
 dictfamilyname[familynamegbk]=1;
 if(dictfirstname.has_key(firstnamegbk)):
 dictfirstname[firstnamegbk]=dictfirstname[firstnamegbk]+1;
 else:
 dictfirstname[firstnamegbk]=1;
 familynameitems=dictfamilyname.items();
 print familynameitems;
 firstnameitems=dictfirstname.items();
 familynameitems.sort(key=lambda d:d[1],reverse=True);
 firstnameitems.sort(key=lambda d :d[1],reverse=True);
 fid=file('familyname.txt','w');
 for m in familynameitems:
 s=m[0]+'	'+str(m[1]);
 fid.write(s);
 fid.write('
');
 fid.close();
 fid=file('firstname.txt','w');
 for m in firstnameitems:
 s=m[0]+'	'+str(m[1]);
 fid.write(s);
 fid.write('
');
 fid.close();
 print 'finish'

运行效果图如下:

更多Python正则表达式匹配中文用法示例相关文章请关注PHP中文网!

文档

Python正则表达式匹配中文用法示例

Python正则表达式匹配中文用法示例:本文实例讲述了Python正则表达式匹配中文用法。分享给大家供大家参考,具体如下:#!/usr/bin/python #-*- coding:cp936-*-#思路,将str转换成unicode,方可用正则表达式,前提是,要知道文件的编码,本例中是gbk import cPickle as m
推荐度:
标签: 使用 中文 示例
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top