最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 科技 - 知识百科 - 正文

Python3处理文件中每个词的方法

来源:动视网 责编:小采 时间:2020-11-27 14:33:44
文档

Python3处理文件中每个词的方法

Python3处理文件中每个词的方法:本文实例讲述了Python3处理文件中每个词的方法。分享给大家供大家参考。具体实现方法如下: ''''' Created on Dec 21, 2012 处理文件中的每个词 @author: liury_lab ''' import codecs the_file = codecs.open('d:/tex
推荐度:
导读Python3处理文件中每个词的方法:本文实例讲述了Python3处理文件中每个词的方法。分享给大家供大家参考。具体实现方法如下: ''''' Created on Dec 21, 2012 处理文件中的每个词 @author: liury_lab ''' import codecs the_file = codecs.open('d:/tex


本文实例讲述了Python3处理文件中每个词的方法。分享给大家供大家参考。具体实现方法如下:

''''' 
Created on Dec 21, 2012 
处理文件中的每个词 
@author: liury_lab 
''' 
import codecs 
the_file = codecs.open('d:/text.txt', 'rU', 'UTF-8') 
for line in the_file: 
 for word in line.split(): 
 print(word, end = "|") 
the_file.close() 
# 若词的定义有变,可使用正则表达式 
# 如词被定义为数字字母,连字符或单引号构成的序列 
import re 
the_file = codecs.open('d:/text.txt', 'rU', 'UTF-8') 
print() 
print('************************************************************************') 
re_word = re.compile('[\w\'-]+') 
for line in the_file: 
 for word in re_word.finditer(line): 
 print(word.group(0), end = "|") 
the_file.close() 
# 封装成迭代器 
def words_of_file(file_path, line_to_words = str.split): 
 the_file = codecs.open('d:/text.txt', 'rU', 'UTF-8') 
 for line in the_file: 
 for word in line_to_words(line): 
 yield word 
 the_file.close() 
print() 
print('************************************************************************') 
for word in words_of_file('d:/text.txt'): 
 print(word, end = '|') 
def words_by_re(file_path, repattern = '[\w\'-]+'): 
 the_file = codecs.open('d:/text.txt', 'rU', 'UTF-8') 
 re_word = re.compile('[\w\'-]+') 
 
 def line_to_words(line): 
 for mo in re_word.finditer(line): 
 yield mo.group(0) # 原书为return,发现结果不对,改为yield 
 return words_of_file(file_path, line_to_words) 
print() 
print('************************************************************************') 
for word in words_by_re('d:/text.txt'): 
 print(word, end = '|')

希望本文所述对大家的Python程序设计有所帮助。

文档

Python3处理文件中每个词的方法

Python3处理文件中每个词的方法:本文实例讲述了Python3处理文件中每个词的方法。分享给大家供大家参考。具体实现方法如下: ''''' Created on Dec 21, 2012 处理文件中的每个词 @author: liury_lab ''' import codecs the_file = codecs.open('d:/tex
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top