Scrapy_shell
Windows命令之令符中输入指令自动进入Scarpy_shell
1 | --scrapy shell |
1 | scrapy shell url #进入网站 |
如果通过xpath无法找到爬取的内容,说明403禁止访问
需要用scrapy模拟浏览器,模拟登陆,要在network中找到
response head响应头
request head请求头,我们需要在请求头里寻找。
首先没有登陆的页面,cookie一般是没有用的。经过测试,大多数是user-agent,拷贝user-agent
1 | scrapy shell -s USER_AGENT='' url |