1、IP必须需要,如果有条件,建议一定要使用代理IP。
有外网IP的机器上,部署爬虫代理服务器。
在程序上,使用轮训替换代理服务器来访问想要采集的网站。
2、ADSL+脚本,监测是否被封,然后不断切换ip。
设置查询频率限制,一般的做法是调用该网站提供的服务接口。
以上就是爬虫抓取时更换ip的方法,考虑到频繁访问一个网站,会被认定为恶意爬取,爬虫代理还是建议结合代理ip。如果大家想测试使用下,可以尝试,免费测试包含各种类ip资源,调用IP量!更多常见问题解决:
推荐操作环境:windows7系统、Python 3.9.1,DELL G3电脑。