下面分享一个使用Python进行网站模拟登陆的小例子。
原理
使用cookie技术,绕开网站登录验证。要使用到cookielib库。流程:
创建一个保存cookie的容器,可选的有cookieJar,FilecookieJar,MozillacookieJar,LWPcookieJar.其相互之间的关系是cookieJar —-派生—->FilecookieJar —-派生—–>MozillacookieJar和LWPcookieJar.
然后创建一个处理cookie的处理器handler.通过urllib2.HTTPcookieProcessor(cookie)即可
创建一个用于开启网站的opener。即可。这个opener相比于urllib2.urlopen方法更为普通一点而已。opener = urllib2.build_opener(handler)。
然后我们就可以正常的使用opener来访问网络了。
小案例
实现的功能是模拟登录到大连理工大学的教务网站。代码如下:
# coding:UTF-8
import urllib,urllib2,cookielib
filename = r'F:pachonggaoqingdlutcookie.txt'
# show cookie and save to local
cookie = cookielib.MozillacookieJar()
handler = urllib2.HTTPcookieProcessor(cookie)
opener = urllib2.build_opener(handler)
# 记得使用urllib模块进行参数的encode
postdata = urllib.urlencode({
# 哈哈,本宫不给你们我的账号╭(╯^╰)╮
'zjh':'xxxxxxxxx',
'mm':'XXXXXX'
})
# 登陆到教务系统的url
url = 'http://zhjw.dlut.edu.cn/loginAction.do'
# 开始进行模拟登陆,并把cookie保存到变量
response = opener.open(url,postdata)
cookie.save(filename,ignore_discard=True,ignore_expires=True)
# 打印一下获得的cookie信息吧
for item in cookie:
item.name + ' = ' + item.value
# 利用cookie访问另一个网址 登陆到个人成绩的URL
course_url='http://zhjw.dlut.edu.cn/xkAction.do?actionType=6'
course_header={
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2486.0 Safari/537.36 Edge/13.10586',
'referer':'http://zhjw.dlut.edu.cn/menu/s_main.jsp'
}
result = opener.open(course_url)
print result.read()
运行结果
总结
其实对于模拟登陆而言,第一次的登陆就是为了获取那个cookie数据。然后通过我们创建的opener来完成接下来我们要进行的关键的进一步的操作。我们需要理解的就只是那个cookie的使用的流程就行了。