最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 科技 - 知识百科 - 正文

通过网页爬虫中cookie自动获取及过期自动更新(详细教程)

来源:动视网 责编:小采 时间:2020-11-27 19:42:57
文档

通过网页爬虫中cookie自动获取及过期自动更新(详细教程)

通过网页爬虫中cookie自动获取及过期自动更新(详细教程):这篇文章主要介绍了网页爬虫之cookie自动获取及过期自动更新的实现方法,需要的朋友可以参考下本文实现cookie的自动获取,及cookie过期自动更新。社交网站中的很多信息需要登录才能获取到,以微博为例,不登录账号,只能看到大V的前十条微博。保持登录状态,必
推荐度:
导读通过网页爬虫中cookie自动获取及过期自动更新(详细教程):这篇文章主要介绍了网页爬虫之cookie自动获取及过期自动更新的实现方法,需要的朋友可以参考下本文实现cookie的自动获取,及cookie过期自动更新。社交网站中的很多信息需要登录才能获取到,以微博为例,不登录账号,只能看到大V的前十条微博。保持登录状态,必
 这篇文章主要介绍了网页爬虫之cookie自动获取及过期自动更新的实现方法,需要的朋友可以参考下

本文实现cookie的自动获取,及cookie过期自动更新。

社交网站中的很多信息需要登录才能获取到,以微博为例,不登录账号,只能看到大V的前十条微博。保持登录状态,必须要用到Cookie。以登录www.weibo.cn 为例:

在chrome中输入:http://login.weibo.cn/login/

分析控制台的Headers的请求返回,会看到weibo.cn有几组返回的cookie。

实现步骤:

1,采用selenium自动登录获取cookie,保存到文件;

2,读取cookie,比较cookie的有效期,若过期则再次执行步骤1;

3,在请求其他网页时,填入cookie,实现登录状态的保持。

1,在线获取cookie

采用selenium + PhantomJS 模拟浏览器登录,获取cookie;

cookies一般会有多个,逐个将cookie存入以.weibo后缀的文件。

2,从文件中获取cookie

从当前目录中遍历以.weibo结尾的文件,即cookie文件。采用pickle解包成dict,比较expiry值与当前时间,若过期则返回为空;

3,若缓存cookie过期,则再次从网络获取cookie

4,带cookie请求微博其他主页

上面是我整理给大家的,希望今后会对大家有帮助。

相关文章:

使用vue中的v-for遍历二维数组的方法

Vue中v-for的数据分组实例

vue2.0 computed 计算list循环后累加值的实例

文档

通过网页爬虫中cookie自动获取及过期自动更新(详细教程)

通过网页爬虫中cookie自动获取及过期自动更新(详细教程):这篇文章主要介绍了网页爬虫之cookie自动获取及过期自动更新的实现方法,需要的朋友可以参考下本文实现cookie的自动获取,及cookie过期自动更新。社交网站中的很多信息需要登录才能获取到,以微博为例,不登录账号,只能看到大V的前十条微博。保持登录状态,必
推荐度:
标签: co 爬虫 网页爬虫
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top