用 Python 实现手机自动答题，这下百万答题游戏谁也玩不过我！-物联网技术文章-傲云油气装备网

作者 | 李秋键

责编 | Carol

出品 | AI科技大本营（ID:rgznai100）

引言

如果谈到这几年手机上各平台最常见的引流福利，必然是答题赢大奖系列小游戏了。像什么头号英雄，百万玩家之类的，充斥在我们生活中，同时也成为了我们生活中常见的娱乐方式。

但是有时候就会想，能不能实现手机自动答题呢，毕竟网络上是充斥着很多问题的答案，自己手动搜题速度显然来不及。答案是当然可以，今天我们就来用手机连接电脑，让电脑自动搜索答案，省时省力省心。

这一项目中主要用到了文字识别和浏览器操作，其中文字识别是利用计算机自动识别字符的技术，是模式识别应用的一个重要领域。

人们在生产和生活中，要处理大量的文字、报表和文本。为了减轻人们的劳动，提高处理效率，50年代开始探讨一般文字识别方法，并研制出光学字符识别器。60年代出现了采用磁性墨水和特殊字体的实用机器。

60年代后期，出现了多种字体和手写体文字识别机，其识别精度和机器性能都基本上能满足要求。如用于信函分拣的手写体数字识别机和印刷体英文数字识别机。70年代主要研究文字识别的基本理论和研制高性能的文字识别机，并着重于汉字识别的研究。

基于一些基础认识，下面我们先来思考下，实现这一项目的整体思路：

做这一项目首先会存在以下疑问：

1、我们要让手机连接电脑，但是怎么让电脑自动控制手机呢

2、手机上是显示文字的，但是怎么让电脑看懂你手机上的文字呢

3、电脑知道了问题后如何借助网络搜答案呢？

针对上面的问题，我们大概想了下思路：

1、让电脑能够控制手机，一般都是利用usb把手机连接到电脑上。然后借助ADB实现对手机的调控，包括点触、滑动、截图等等功能。

2、让电脑能够看懂文字，必然需要对手机屏幕截图，然后对截图中的文字识别即可

3、让电脑操控浏览器搜题，用python的库即可实现

了解了整体思路后，下面开始我们的实验。

实验前的准备

首先我们使用的python版本是3.6.5所用到的库有os，Python 中os模块包含普遍的操作系统功能。

如果你希望你的程序能够与平台无关的话，这个模块是尤为重要的；pillow库中Image模块是在Python PIL图像处理中常见的模块，对图像进行基础操作的功能基本都包含于此模块内；Pytesseract模块是文字识别模块；webbrowser是实现浏览器的操作；time库实现等待下一题之间的间隔时间等待。

自动获取手机文字

1、利用ADB控制手机：

ADB是安卓手机常见的调控插件，我们需要将手机数据线和电脑连接，然后借助adb实现对手机的截屏并保存在指定路径。Adb控制指令如下：

截取屏幕，图片命名为screen.png ：

os.system("adb shell /system/bin/screencap -p /sdcard/screen.png") #截取屏幕，图片命名为screen.png

将截图保存到电脑,路径为：C:/Users/jia/Desktop

os.system("adb pull /sdcard/screen.png C:/Users/jia/Desktop")   #将截图保存到电脑在桌面

模拟点击屏幕，x y分别为点击处的像素

os.system("adb shell input tap {}{}".format(x,y))#x ，y为点击处的像素点

详细代码如下：

#adb手机截图
def get_image():
os.system('adb shell screencap -p /sdcard/image.png')
os.system('adb pull /sdcard/image.png .')
xigua_size = (150,530,1800,800)

2、对图片文字识别：

文字识别部分为了方便快速，我们直接使用pytesseract文字识别即可。其中主要用的函数是pytesseract.image_to_strin。

pytesser里包含了tesseract.exe和英语的数据包（默认只识别英文），还有一些示例图片，所以解压缩后即可使用。

同时模块需要PIL库的支持。

如何识别率低的问题？

可以增强图片的显示效果，或者将其转换为黑白的，这样可以使其识别率提升不少。

识别其他语言？

tesseract是一个命令行下运行的程序，参数如下：

tesseract  imagename outbase [-l  lang]  [-psm N]  [configfile...]

imagename是输入的image的名字，outbase是输出的文本的名字，默认为outbase.txt ，-l lang 是定义要识别的的语言，默认为英文。

详细代码如下：

#读取图像
get_image()
img=Image.open('image.png')
img_que = img.crop(xigua_size)
#识别截图文字
question=pytesseract.image_to_string(img_que,lang='chi_sim')

获取文字后，对文字做一些处理，去除没必要的信息。

question=question.replace(' ','').replace('\n','')
que = question[question.find('.')+1: question.find('?')]

自动搜题的实现

1、浏览器操作：

在识别问题的基础上，我们通过webbrowser打开浏览器，并操作浏览器搜索答案。

其中主要用到的方法如下：

webbrowser 有以下方法：

webbrowser.open(url[, new=0[, autoraise=1]])

这个方法是在默认的浏览器中显示url, 如果new = 0, 那么url会在同一个浏览器窗口下打开，如果new = 1, 会打开一个新的窗口，如果new = 2, 会打开一个新的tab, 如果autoraise = true, 窗口会自动增长。

webbrowser.open_new(url)

在默认浏览器中打开一个新的窗口来显示url, 否则，在仅有的浏览器窗口中打开url。

webbrowser.open_new_tab(url)

在默认浏览器中当开一个新的tab来显示url, 否则跟open_new()一样、

webbrowser.get([name])

根据name返回一个浏览器对象，如果name为空，则返回默认的浏览器

webbrowser.register(name, construtor[, instance])

注册一个名字为name的浏览器，如果这个浏览器类型被注册就可以用get()方法来获取。

详细代码如下：

#引擎搜索
url = "https://www.baidu.com/s?wd=" +que
webbrowser.open(url)
get_image()
img=Image.open('image.png')
img_que = img.crop(xigua_size)
question1= pytesseract.image_to_string(img_que,)
question1=question1.replace(' ','').replace('\n','')
que = question1[question.find('.')+1: question.find('?')]

while True:
while(question1==question):
get_image()
img = Image.open('image.png')
img_que = img.crop(xigua_size)
question1 = pytesseract.image_to_string(img_que,)
question1 = question1.replace(' ', '').replace('\n', '')
que = question1[question.find('.') + 1: question.find('?')]
get_image()
img = Image.open('image.png')
img_que = img.crop(xigua_size)
# 识别截图文字
question = pytesseract.image_to_string(img_que,)
question = question.replace(' ', '').replace('\n', '')
que = question[question.find('.') + 1: question.find('?')]
continue
while(question1!=question):
get_image()
img = Image.open('image.png')
img_que = img.crop(xigua_size)
# 识别截图文字
question = pytesseract.image_to_string(img_que,)
question1 = pytesseract.image_to_string(img_que,)
question1 = question1.replace(' ', '').replace('\n', '')
que = question1[question.find('.') + 1: question.find('?')]
question = question.replace(' ', '').replace('\n', '')
que = question[question.find('.') + 1: question.find('?')]
# 引擎搜索
url = "https://www.baidu.com/s?wd=" + que
webbrowser.open(url)
continue

到这里，我们整体的程序就搭建完成，下面为我们程序的运行结果：

试试用这个方法参加《百万答题》类小游戏，或许下一个百万获奖人就是你。

作者介绍：

李秋键，CSDN 博客专家，CSDN达人课作者。硕士在读于中国矿业大学，开发有taptap安卓武侠游戏一部，vip视频解析，文意转换工具，写作机器人等项目，发表论文若干，多次高数竞赛获奖等等。

今日福利

遇见大咖

由 CSDN 全新专为技术人打造的高端对话栏目《大咖来了》来啦！

CSDN 创始人&董事长、极客帮创投创始合伙人蒋涛携手京东集团技术副总裁、IEEE Fellow、京东人工智能研究院常务副院长、深度学习及语音和语言实验室负责人何晓冬，来也科技 CTO 胡一川，共话中国 AI 应用元年来了，开发者及企业的路径及发展方向！

戳链接或点击阅读原文，直达报名：https://t.csdnimg.cn/uZfQ

• Pytorch贝叶斯深度学习库BLiTZ实现LSTM模型预测	• Android \| 教你如何快速集成机器学习能力
• Python实现破解猜数游戏算法示例	• Spark深入解析（九）：RDD的转换-双Value类型
• ElasticSearch集成个性化中文分词插件	• GitHub Student Developer Pack的申请流程及国

• Esp8266天猫精灵_RGB灯_非点灯平台	• STM32F103 串口1和串口3对发数据配合蓝牙模块
• TMS570学习【1】了解什么是TMS570	• 新闻稿 \| Qt公司收购froglogic公司以巩固市场领
• [Java]SpringBoot2整合mqtt服务器EMQ实现消息订	• 苹果群控投屏同步操作原理及运用的平台APP分享

• Esp8266天猫精灵_RGB灯_非点灯平台	• STM32F103 串口1和串口3对发数据配合蓝牙模块
• TMS570学习【1】了解什么是TMS570	• 新闻稿 \| Qt公司收购froglogic公司以巩固市场领
• [Java]SpringBoot2整合mqtt服务器EMQ实现消息订	• 苹果群控投屏同步操作原理及运用的平台APP分享
• STM32查询式按键输入[直接用寄存器]	• Ubuntu系统 USB设备端口绑定
• 2021-04-14 第四次按键输入实验	• Flutter扫码功能完美实现