最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 科技 - 知识百科 - 正文

详解用python的BeautifulSoup分析html方法

来源:动视网 责编:小采 时间:2020-11-27 14:24:43
文档

详解用python的BeautifulSoup分析html方法

详解用python的BeautifulSoup分析html方法:1) 搜索tag:find(tagname) # 直接搜索名为tagname的tag 如:find('head')find(list) # 搜索在list中的tag,如: find(['head', 'body'])find(dict) # 搜索在dict中的tag,如:find({'
推荐度:
导读详解用python的BeautifulSoup分析html方法:1) 搜索tag:find(tagname) # 直接搜索名为tagname的tag 如:find('head')find(list) # 搜索在list中的tag,如: find(['head', 'body'])find(dict) # 搜索在dict中的tag,如:find({'


1) 搜索tag:

find(tagname) # 直接搜索名为tagname的tag 如:find('head')
find(list) # 搜索在list中的tag,如: find(['head', 'body'])
find(dict) # 搜索在dict中的tag,如:find({'head':True, 'body':True})
find(re.compile('')) # 搜索符合正则的tag, 如:find(re.compile('^p')) 搜索以p开头的tag
find(lambda) # 搜索函数返回结果为true的tag, 如:find(lambda name: if len(name) == 1) 搜索长度为1的tag
find(True) # 搜索所有tag

2) 搜索文字(text)

3) recursive, limit:

from bs4 import BeautifulSoup
import re
 
doc = ['<html><head><title>Page title</title></head>',
 '<body><p id="firstpara" align="center">This is paragraph <b>one</b>.',
 '<p id="secondpara" align="blah">This is paragraph <b>two</b>.',
 '</html>']
soup = BeautifulSoup(''.join(doc))
 
print soup.prettify()+"
"
print soup.findAll('b')
 
print soup.findAll(text=re.compile("paragraph"))
print soup.findAll(text=True)
print soup.findAll(text=lambda(x):len(x)<12)
 
a = soup.findAll(re.compile('^b'))
print [tag.name for tag in a]
 
print [tag.name for tag in soup.html.findAll()]
print [tag.name for tag in soup.html.findAll(recursive=False)]
 
print soup.findAll('p',limit=1)

文档

详解用python的BeautifulSoup分析html方法

详解用python的BeautifulSoup分析html方法:1) 搜索tag:find(tagname) # 直接搜索名为tagname的tag 如:find('head')find(list) # 搜索在list中的tag,如: find(['head', 'body'])find(dict) # 搜索在dict中的tag,如:find({'
推荐度:
标签: 详解 解析 html
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top