最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 科技 - 知识百科 - 正文

pythonBeautifulSoup设置页面编码的方法

来源:动视网 责编:小采 时间:2020-11-27 14:32:18
文档

pythonBeautifulSoup设置页面编码的方法

pythonBeautifulSoup设置页面编码的方法:在用BeautifulSoup进行抓取页面的时候,会各种各样的编码错误。 可以通过在beautifulsoup中指定字符编码,解决问题。 代码如下: import urllib2 from BeautifulSoup import BeautifulSoup page = urllib2.urlopen(
推荐度:
导读pythonBeautifulSoup设置页面编码的方法:在用BeautifulSoup进行抓取页面的时候,会各种各样的编码错误。 可以通过在beautifulsoup中指定字符编码,解决问题。 代码如下: import urllib2 from BeautifulSoup import BeautifulSoup page = urllib2.urlopen(

在用BeautifulSoup进行抓取页面的时候,会各种各样的编码错误。
可以通过在beautifulsoup中指定字符编码,解决问题。
代码如下:


import urllib2
from BeautifulSoup import BeautifulSoup

page = urllib2.urlopen('http://www.163.com');
soup = BeautifulSoup(page,from_encoding="gb2312")

print soup.originalEncoding
print soup.prettify()


红色部分表示需要注意的地方。在BeautifulSoup构造器中传入fromEncoding参数即可解决乱码问题,当然具体参数值是什么就要看你获取页面的编码是什么

文档

pythonBeautifulSoup设置页面编码的方法

pythonBeautifulSoup设置页面编码的方法:在用BeautifulSoup进行抓取页面的时候,会各种各样的编码错误。 可以通过在beautifulsoup中指定字符编码,解决问题。 代码如下: import urllib2 from BeautifulSoup import BeautifulSoup page = urllib2.urlopen(
推荐度:
标签: 方法 办法 页面
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top