百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

用 Python 实现手机自动答题,下一个百万获奖人可能就是你

liuian 2025-02-13 13:05 25 浏览

作者 | 李秋键

责编 | Carol

出品 | AI科技大本营(ID:rgznai100)

如果谈到这几年手机上各平台最常见的引流福利,必然是答题赢大奖系列小游戏了。像什么头号英雄,百万玩家之类的,充斥在我们生活中,同时也成为了我们生活中常见的娱乐方式。

但是有时候就会想,能不能实现手机自动答题呢,毕竟网络上是充斥着很多问题的答案,自己手动搜题速度显然来不及。答案是当然可以,今天我们就来用手机连接电脑,让电脑自动搜索答案,省时省力省心。

这一项目中主要用到了文字识别和浏览器操作,其中文字识别是利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。

人们在生产和生活中,要处理大量的文字、报表和文本。为了减轻人们的劳动,提高处理效率,50年代开始探讨一般文字识别方法,并研制出光学字符识别器。60年代出现了采用磁性墨水和特殊字体的实用机器。

60年代后期,出现了多种字体和手写体文字识别机,其识别精度和机器性能都基本上能满足要求。如用于信函分拣的手写体数字识别机和印刷体英文数字识别机。70年代主要研究文字识别的基本理论和研制高性能的文字识别机,并着重于汉字识别的研究。

基于一些基础认识,下面我们先来思考下,实现这一项目的整体思路:

做这一项目首先会存在以下疑问:

  1. 我们要让手机连接电脑,但是怎么让电脑自动控制手机呢?

  2. 手机上是显示文字的,但是怎么让电脑看懂你手机上的文字呢?

  3. 电脑知道了问题后如何借助网络搜答案呢?

针对上面的问题,我们大概想了下思路:

  1. 让电脑能够控制手机,一般都是利用usb把手机连接到电脑上。然后借助ADB实现对手机的调控,包括点触、滑动、截图等等功能。

  2. 让电脑能够看懂文字,必然需要对手机屏幕截图,然后对截图中的文字识别即可

  3. 让电脑操控浏览器搜题,用python的库即可实现

了解了整体思路后,下面开始我们的实验。

实验前的准备

首先我们使用的python版本是3.6.5所用到的库有os,Python 中os模块包含普遍的操作系统功能。

如果你希望你的程序能够与平台无关的话,这个模块是尤为重要的;pillow库中Image模块是在Python PIL图像处理中常见的模块,对图像进行基础操作的功能基本都包含于此模块内;Pytesseract模块是文字识别模块;webbrowser是实现浏览器的操作;time库实现等待下一题之间的间隔时间等待。

自动获取手机文字

1、利用ADB控制手机:

ADB是安卓手机常见的调控插件,我们需要将手机数据线和电脑连接,然后借助adb实现对手机的截屏并保存在指定路径。Adb控制指令如下:

截取屏幕,图片命名为screen.png :

os.system("adb shell /system/bin/screencap -p /sdcard/screen.png") #截取屏幕,图片命名为screen.png

将截图保存到电脑,路径为:C:/Users/jia/Desktop

os.system("adb pull /sdcard/screen.png C:/Users/jia/Desktop") #将截图保存到电脑在桌面

模拟点击屏幕,x y分别为点击处的像素

os.system("adb shell input tap {}{}".format(x,y))#x ,y为点击处的像素点

详细代码如下:

#adb手机截图def get_image:os.system('adb shell screencap -p /sdcard/image.png')os.system('adb pull /sdcard/image.png .')xigua_size = (150,530,1800,800)

2、对图片文字识别:

文字识别部分为了方便快速,我们直接使用pytesseract文字识别即可。其中主要用的函数是
pytesseract.image_to_strin。

pytesser里包含了tesseract.exe和英语的数据包(默认只识别英文),还有一些示例图片,所以解压缩后即可使用。

同时模块需要PIL库的支持。

如何识别率低的问题?

可以增强图片的显示效果,或者将其转换为黑白的,这样可以使其识别率提升不少。

识别其他语言?

tesseract是一个命令行下运行的程序,参数如下:

tesseract imagename outbase [-l lang] [-psm N] [configfile...]

imagename是输入的image的名字,outbase是输出的文本的名字,默认为outbase.txt ,-l lang 是定义要识别的的语言,默认为英文。

详细代码如下:

#读取图像get_imageimg=Image.open('image.png')img_que = img.crop(xigua_size)#识别截图文字question=pytesseract.image_to_string(img_que,lang='chi_sim')

获取文字后,对文字做一些处理,去除没必要的信息。

question=question.replace(' ','').replace('\n','')que = question[question.find('.')+1: question.find('?')]

自动搜题的实现

1、浏览器操作:

在识别问题的基础上,我们通过webbrowser打开浏览器,并操作浏览器搜索答案。

其中主要用到的方法如下:

  • webbrowser 有以下方法:

webbrowser.open(url[, new=0[, autoraise=1]])

这个方法是在默认的浏览器中显示url, 如果new = 0, 那么url会在同一个浏览器窗口下打开,如果new = 1, 会打开一个新的窗口,如果new = 2, 会打开一个新的tab, 如果autoraise = true, 窗口会自动增长。

webbrowser.open_new(url)

在默认浏览器中打开一个新的窗口来显示url, 否则,在仅有的浏览器窗口中打开url。

webbrowser.open_new_tab(url)

在默认浏览器中当开一个新的tab来显示url, 否则跟open_new一样、

webbrowser.get([name])

根据name返回一个浏览器对象,如果name为空,则返回默认的浏览器

webbrowser.register(name, construtor[, instance])

注册一个名字为name的浏览器,如果这个浏览器类型被注册就可以用get方法来获取。

详细代码如下:

#引擎搜索url = "https://www.baidu.com/s?wd=" +quewebbrowser.open(url)get_imageimg=Image.open('image.png')img_que = img.crop(xigua_size)question1= pytesseract.image_to_string(img_que,)question1=question1.replace(' ','').replace('\n','')que = question1[question.find('.')+1: question.find('?')]
while True:while(question1==question):get_imageimg = Image.open('image.png')img_que = img.crop(xigua_size)question1 = pytesseract.image_to_string(img_que,)question1 = question1.replace(' ', '').replace('\n', '')que = question1[question.find('.') + 1: question.find('?')]get_imageimg = Image.open('image.png')img_que = img.crop(xigua_size)# 识别截图文字question = pytesseract.image_to_string(img_que,)question = question.replace(' ', '').replace('\n', '')que = question[question.find('.') + 1: question.find('?')]continuewhile(question1!=question):get_imageimg = Image.open('image.png')img_que = img.crop(xigua_size)# 识别截图文字question = pytesseract.image_to_string(img_que,)question1 = pytesseract.image_to_string(img_que,)question1 = question1.replace(' ', '').replace('\n', '')que = question1[question.find('.') + 1: question.find('?')]question = question.replace(' ', '').replace('\n', '')que = question[question.find('.') + 1: question.find('?')]# 引擎搜索url = "https://www.baidu.com/s?wd=" + quewebbrowser.open(url)continue

到这里,我们整体的程序就搭建完成,下面为我们程序的运行结果:

试试用这个方法参加《百万答题》类小游戏,或许下一个百万获奖人就是你。

作者介绍:

李秋键,CSDN 博客专家,CSDN达人课作者。硕士在读于中国矿业大学,开发有taptap安卓武侠游戏一部,vip视频解析,文意转换工具,写作机器人等项目,发表论文若干,多次高数竞赛获奖等等。

新勋章,新奖品,高流量,还有更多福利等你来拿~

?360金融新任首席科学家:别指望AI Lab做成中台

?搞懂微服务,从捕捉一头野猪说起

?AI 图像智能修复老照片,效果惊艳到我了!| 附代码

?调查了 10,975 位 Go 语言开发者,我们有了这些发现!

?架构师前辈告诉你:代码该如何才能自己写得容易,别人看得也不痛苦

相关推荐

教你把多个视频合并成一个视频的方法

一.情况介绍当你有一个m3u8文件和一个目录,目录中有连续的视频片段,这些片段可以连成一段完整的视频。m3u8文件打开后像这样:m3u8文件,可以理解为播放列表,里面是播放视频片段的顺序。视频片段像这...

零代码编程:用kimichat合并一个文件夹下的多个文件

一个文件夹里面有很多个srt字幕文件,如何借助kimichat来自动批量合并呢?在kimichat对话框中输入提示词:你是一个Python编程专家,完成如下的编程任务:这个文件夹:D:\downloa...

Java APT_java APT 生成代码

JavaAPT(AnnotationProcessingTool)是一种在Java编译阶段处理注解的工具。APT会在编译阶段扫描源代码中的注解,并根据这些注解生成代码、资源文件或其他输出,...

Unit Runtime:一键运行 AI 生成的代码,或许将成为你的复制 + 粘贴神器

在我们构建了UnitMesh架构之后,以及对应的demo之后,便着手于实现UnitMesh架构。于是,我们就继续开始UnitRuntime,以用于直接运行AI生成的代码。PS:...

挣脱臃肿的枷锁:为什么说Vert.x是Java开发者手中的一柄利剑?

如果你是一名Java开发者,那么你的职业生涯几乎无法避开Spring。它如同一位德高望重的老国王,统治着企业级应用开发的大片疆土。SpringBoot的约定大于配置、SpringCloud的微服务...

五年后,谷歌还在全力以赴发展 Kotlin

作者|FredericLardinois译者|Sambodhi策划|Tina自2017年谷歌I/O全球开发者大会上,谷歌首次宣布将Kotlin(JetBrains开发的Ja...

kotlin和java开发哪个好,优缺点对比

Kotlin和Java都是常见的编程语言,它们有各自的优缺点。Kotlin的优点:简洁:Kotlin程序相对于Java程序更简洁,可以减少代码量。安全:Kotlin在类型系统和空值安全...

移动端架构模式全景解析:从MVC到MVVM,如何选择最佳设计方案?

掌握不同架构模式的精髓,是构建可维护、可测试且高效移动应用的关键。在移动应用开发中,选择合适的软件架构模式对项目的可维护性、可测试性和团队协作效率至关重要。随着应用复杂度的增加,一个良好的架构能够帮助...

颜值非常高的XShell替代工具Termora,不一样的使用体验!

Termora是一款面向开发者和运维人员的跨平台SSH终端与文件管理工具,支持Windows、macOS及Linux系统,通过一体化界面简化远程服务器管理流程。其核心定位是解决多平台环境下远程连接、文...

预处理的底层原理和预处理编译运行异常的解决方案

若文章对您有帮助,欢迎关注程序员小迷。助您在编程路上越走越好![Mac-10.7.1LionIntel-based]Q:预处理到底干了什么事情?A:预处理,顾名思义,预先做的处理。源代码中...

为“架构”再建个模:如何用代码描述软件架构?

在架构治理平台ArchGuard中,为了实现对架构的治理,我们需要代码+模型描述所要处理的内容和数据。所以,在ArchGuard中,我们有了代码的模型、依赖的模型、变更的模型等,剩下的两个...

深度解析:Google Gemma 3n —— 移动优先的轻量多模态大模型

2025年6月,Google正式发布了Gemma3n,这是一款能够在2GB内存环境下运行的轻量级多模态大模型。它延续了Gemma家族的开源基因,同时在架构设计上大幅优化,目标是让...

比分网开发技术栈与功能详解_比分网有哪些

一、核心功能模块一个基本的比分网通常包含以下模块:首页/总览实时比分看板:滚动展示所有正在进行的比赛,包含比分、比赛时间、红黄牌等关键信息。热门赛事/焦点战:突出显示重要的、关注度高的比赛。赛事导航...

设计模式之-生成器_一键生成设计

一、【概念定义】——“分步构建复杂对象,隐藏创建细节”生成器模式(BuilderPattern):一种“分步构建型”创建型设计模式,它将一个复杂对象的构建与其表示分离,使得同样的构建过程可以创建...

构建第一个 Kotlin Android 应用_kotlin简介

第一步:安装AndroidStudio(推荐IDE)AndroidStudio是官方推荐的Android开发集成开发环境(IDE),内置对Kotlin的完整支持。1.下载And...