可以想象我现在内心的崩溃程度。
我知道,信息无时无刻不在侧漏,但是你自己抓取到了,那真的是。。。
作案经过
作案经过是这样的:
我这两天不是在学小饼干cookies嘛,就想着抓自己玩玩。
于是我熟练的打开了谷歌,修改了密码,因为我早不记得密码是什么了。
登录的那一瞬间,抓包就开始了。
你管我怎么打开这个界面的,反正登录的时候你就打开,记住上面要跟我选一样的,Network,然后那个蓝勾勾上,下面选XHR,这是最低配置了。
好,登录。
登录完之后,就能看到有一堆的东西突然跑出来。
要点哪个可以去看我前一篇博客《我要偷偷的学Python(第九天)》
不过这次我们不看Preview,直接看Headers,找到小饼干,很多个包里面都有的,不过东西最齐全的还是那个announcement的包。
打开它。
作案工具
import requests
from bs4 import BeautifulSoup
cookie = '''*此处粘贴从chrome中复制的cookie信息*'''
header = {
'User-Agent': '放你自己的',
'Connection': 'keep-alive',
'accept': '放你自己的',
'Cookie': cookie,
'referer': '放你自己的博客主页地址'
}
url = 'https://me.csdn.net/api/user/show' # csdn 个人中心中,加载名字的js地址
seesion = requests.session()
response = seesion.get(url,headers=header)
#response.coding="gbk"
wbdata = response.text
print("正在打开请求")
print(response.url)
print()
soup = BeautifulSoup(wbdata,'html.parser')
print(soup)
该填你自己的东西的地方填你自己的东西。
然后你会发现打出一串字符串。
里面有不少网址,把转义用的‘\’去掉,一个网址一个网址的去看,如果你有认证学校信息或者工位等信息,嗯嗯