干货|Python大佬手把手带你破解哔哩哔哩网滑动验证(上篇)
liuian 2025-07-03 17:04 3 浏览
/1 前言/
有爬虫经验的各位小伙伴都知道,正常我们需要登录才能获取信息的网站,是比较难爬的。原因就是在于,现在各大网站为了反爬,与爬虫机制斗智斗勇,一般的都加入了图片验证码、滑动验证码之类的干扰,让我们的爬虫半途折返。
本篇文章主要是针对哔哩哔哩的滑动验证码进行讲解和破解。
/2 方法探讨/
写这个文章之前,我就在想一个问题,关于破解滑动验证究竟是使用机器学习还是第三方服务的方法会比较好一些。关于这个问题,先说一下个人观点:本人作为一个爬虫老鸟,如果只是为了使用,非常建议使用第三方服务。主要原因有以下两点。
1、现在是2020年了,在IT行业的小伙伴们都知道一个事实,现在大红大紫的热门行业肯定都说是机器学习,大家都想入门机器学习。但是很多人还没入门就GG了,这是为什么呢?因为入门机器学习,是需要有高等数学底子的,可不是以前学一个语言,会常用逻辑就可以入门了的。这也是为什么到现在为止,依然还有非常大的机器学习人才缺口。
2、机器学习,一般玩不起。首先,你需要有大量的数据,然后再有一个不错的主机用于训练,再然后,就是需要你有高等数学的底子。如果这三个你的具备,并且学习了机器学习,你才可以勉强破解滑动验证码,并且还不敢保证自己训练的准确度。
以上就是我推荐使用第三方接口的原因,因为第三方接口就是专门做这类机器学习的。它们有强大的人力物力专门做破解各种验证码,并且识别率非常高,现在一般都是90%以上。此外,不仅价格还香,还可以让自己少掉很多根头发,何乐而不为了呢?
话说回来,并不是说我不建议学习机器学习。毕竟现在我们是处于一个人工智能时代,如果你已有不错的数学基础,并且对机器学习饶有兴趣,在工作或者学习之余,可以学习一下机器学习的,毕竟趋势如此,紧跟潮流。
简单总结一下:如果你的爬虫遇到了滑动验证码,建议直接使用第三方平台。如果你对机器学习很有兴趣,想尝试一下新方法,可以考虑一下机器学习。
/3 所需工具/
本文中使用的工具和之前不太一样,这次暂时没有用到selenium,而是使用了第三方服务:https://2captcha.com/。根据本人测试,这个平台是目前识别率最高的平台,价格也还行,3美元几百次的样子。接下来,我详细讲解一下这个打码平台。
本文中使用的工具和之前不太一样,这次暂时没有用到selenium,而是使用了第三方服务:https://2captcha.com/,这里我们只需要 requests 模块就可以啦!
/4 打码平台参数分析/
根据本人测试,这个平台是目前识别率最高的平台,价格也还行,3美元几百次的样子。接下来,我详细讲解一下这个打码平台。
既然我们选择了第三方平台,我们务必要看一下人家的文档,看看别人是怎么操作的。下面我们就2captcha平台的极验破解,看看官网上是如何实现的。
额...纯英文的,我也看不懂。。。这咋回事呢?这咋办哪?这可咋整啊?别慌,问题不大,小编带你们一步一步分析主要功能。
1、首先我们需要登录到账号,如下图所示,右上方有个Sign的提示,如果没有账号的话,得点击右上方的Register进行注册账号即可。
2、当登录完成后,会自动跳到主页,如下图所示。
上图中长方形框框圈起来的地方表示你的账户余额剩余多少钱,账户资金不足的话记得要氪金,否则是不能用滴,氪金过程这里就不多做解释了哈,问题不大。椭圆框框圈起来的地方表示的是你的唯一key值,每次请求要带上这个key的,所以你务必要保管好。
3、前期工作完成之后,接下来我们进入主题,研究文档。点击下图中红色圈的地方,API(全称是:Application Programming Interface,应用程序接口),一般API下面存放的都是文档。
4、之后弹出的界面就让人有些傻眼了,如下图所示。
额,尴尬的一批,这全部是英文额,不过不要慌,问题不大,继续往下滑动看看。
5、诶,在下方这里我们可以找到一个列表,如下图所示。
滑动到Rates这个菜单栏,我们能看到一个列表,我们要解决的就是极验(GeeTest,就是极验的英文翻译),所以我们只需要看GeeTest就好了,可以看到上面显示的单价是2.99美元。之后我们点击GeeTest,页面会进行跳转。
6、之后会弹出下图的英文界面,估计小伙伴们有的望而却步一波了。
7、不过仍然不要慌,别忘记了,我们还有翻译呢!点击浏览器的翻译功能,页面突然间就变得熟悉了,如下图所示。
这下是不是感觉清晰了很多了?虽然有些翻译的不尽人意,但是基本上我们能够明白翻译过来的意思,顺藤摸瓜,可以搞定原英文想要表达的意思。如果你英文好的话,就不用像小编这样这么费劲啦,给英文大佬打call!
可以看到上文中的操作提示,我们需要找到目标网站的gt,challenge和api_server三个值,然后,加上其他一些参数发送到网址
https://2captcha.com/in.php,之后该网址会返回一个任务ID。
然后等个15秒左右以后,再向
https://2captcha.com/res.php请求,带上任务ID加上一些其他参数,即可进行破解。
/5 总结/
写到这里,这篇文章已经超过2000个字了,估计小伙伴们都没有耐心看下去了,小编在这里大概整理一下上文的大体意思。
1、首先,我们确定需要第三方平台去帮助我们破解极验,之后我们需要找到这个第三方平台,并且需要进行注册。
2、注册之后,我们需要阅读API操作文档。
3、根据API操作文档,在翻译的帮助下,找到目标网站的gt,challenge和api_server三个值,然后,加上其他一些参数发送到
https://2captcha.com/in.php,会返回一个任务ID。
4、然后等个15秒左右以后,再像
https://2captcha.com/res.php请求,带上任务ID加上一些其他参数,即可进行破解。
介于篇幅原因,这篇文章主要介绍了第三方打码平台和破解的理论部分,下一篇文章将详细介绍破解哔哩哔哩极验的具体过程,小伙伴们敬请期待吧!
相关推荐
- 软件测试/测试开发丨Pytest 自动化测试框架(五)
-
公众号搜索:TestingStudio霍格沃兹测试开发的干货都很硬核测试报告在项目中是至关重要的角色,一个好的测试报告:可以体现测试人员的工作量;开发人员可以从测试报告中了解缺陷的情况;测试经理可以...
- python爬虫实战之Headers信息校验-Cookie
-
一、什么是cookie上期我们了解了User-Agent,这期我们来看下如何利用Cookie进行用户模拟登录从而进行网站数据的爬取。首先让我们来了解下什么是Cookie:Cookie指某些网站为了辨别...
- 软件测试 | 结合Allure生成测试报告
-
简介测试报告在项目至关重要,测试人员可以在测试报告中体现自己的工作量,开发人员可以从测试报告中了解缺陷的情况,测试经理可以从测试报告中看到测试人员的执行情况及测试用例的覆盖率,项目负责人可以通过测...
- 使用FUSE挖掘文件上传漏洞(文件上传漏洞工具)
-
关于FUSEFUSE是一款功能强大的渗透测试安全工具,可以帮助广大研究人员在最短的时间内迅速寻找出目标软件系统中存在的文件上传漏洞。FUSE本质上是一个渗透测试系统,主要功能就是识别无限制可执行文件上...
- 第42天,我终于意识到,爬虫这条路,真的好艰难
-
昨天说到学爬虫的最初四行代码,第四行中的print(res.text),我没太懂。为啥最后的输出的结果,不是显示百度网页全部的源代码呢?这个世界上永远不缺好心人。评论区的大神告诉我:因为只包含静态h...
- 详解Pytest单元测试框架,轻松搞定自动化测试实战
-
pytest是目前企业里面使用最多、最流行的Python的单元测试框架,那我们今天就使用这个框架来完成一个网易163邮箱登录的自动化实战案例。下面我们先把我们案例需要的工具进行相关的介绍:01pyt...
- 干货|Python大佬手把手带你破解哔哩哔哩网滑动验证(上篇)
-
/1前言/有爬虫经验的各位小伙伴都知道,正常我们需要登录才能获取信息的网站,是比较难爬的。原因就是在于,现在各大网站为了反爬,与爬虫机制斗智斗勇,一般的都加入了图片验证码、滑动验证码之类的干扰,让...
- Python 爬虫-如何抓取需要登录的网页
-
本文是Python爬虫系列第四篇,前三篇快速入口:Python爬虫-开启数据世界的钥匙Python爬虫-HTTP协议和网页基础Python爬虫-使用requests和B...
- 使用Selenium实现微博爬虫:预登录、展开全文、翻页
-
前言想实现爬微博的自由吗?这里可以实现了!本文可以解决微博预登录、识别“展开全文”并爬取完整数据、翻页设置等问题。一、区分动态爬虫和静态爬虫1、静态网页静态网页是纯粹的HTML,没有后台数据库,不含程...
- 从零开始学Python——使用Selenium抓取动态网页数据
-
1.selenium抓取动态网页数据基础介绍1.1什么是AJAX AJAX(AsynchronouseJavaScriptAndXML:异步JavaScript和XML)通过在后台与服务器进...
- PHP自动测试框架Top 10(php单元测试工具)
-
对于很多PHP开发新手来说,测试自己编写的代码是一个非常棘手的问题。如果出现问题,他们将不知道下一步该怎么做。花费很长的时间调试PHP代码是一个非常不明智的选择,最好的方法就是在编写应用程序代码之前就...
- 10款最佳PHP自动化测试框架(php 自动化测试)
-
为什么测试如此重要?PHP开发新手往往不会测试自己编写的代码,我们中的大多数通过不断测试我们刚刚所编写浏览器窗口的新特性和功能来进行检测,但是当事情出现错误的时候我们往往不知道应该做些什么。为我们的代...
- 自动化运维:Selenium 测试(seleniumbase搭建自动化测试平台)
-
本文将以Buddy中的Selenium测试流水线示例,来看看自动化测试就是如此简单易用!Selenium是一套用于浏览器测试自动化的工具。使用Buddy专有服务,您可以直接在Buddy中运行Selen...
- Selenium自动化测试(selenium自动化测试工具)
-
Selenium是一系列基于web的自动化测试工具。它提供了一系列测试函数,用于支持Web自动化测试。这些函数非常灵活,它们能够通过多种方式定位界面元素,并可以将预期结果与系统实际表现进行比较。作为一...
- 技术分享 | Web自动化之Selenium安装
-
本文节选自霍格沃兹测试开发学社内部教材Web应用程序的验收测试常常涉及一些手工任务,例如打开一个浏览器,并执行一个测试用例中所描述的操作。但是手工执行的任务容易出现人为的错误,也比较费时间。因此,将...
- 一周热门
-
-
Python实现人事自动打卡,再也不会被批评
-
Psutil + Flask + Pyecharts + Bootstrap 开发动态可视化系统监控
-
【验证码逆向专栏】vaptcha 手势验证码逆向分析
-
一个解决支持HTML/CSS/JS网页转PDF(高质量)的终极解决方案
-
再见Swagger UI 国人开源了一款超好用的 API 文档生成框架,真香
-
网页转成pdf文件的经验分享 网页转成pdf文件的经验分享怎么弄
-
C++ std::vector 简介
-
系统C盘清理:微信PC端文件清理,扩大C盘可用空间步骤
-
10款高性能NAS丨双十一必看,轻松搞定虚拟机、Docker、软路由
-
python使用fitz模块提取pdf中的图片
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- table.render (33)
- uniapp textarea (33)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)