百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

程序员用 Python 爬取抖音高颜值美女

liuian 2025-02-13 13:06 79 浏览

图书+视频+源代码+答疑群,一本书带你入Python

作者 | 星安果

本文经授权转载自AirPython(ID:AirPython)

目 标 场 景

相信大家平时刷抖音短视频的时候,看到颜值高的小姐姐,都有随手点赞关注的习惯。

如果一条条去刷确实很耗时间,如果 Python 能帮忙筛选出颜值高的小姐姐那就省了很多事。

本篇文章是借助「百度人脸识别」API,帮我们识别出抖音上颜值高的小姐姐,然后下载到手机相册中。

准 备 工 作

首先,项目需要对页面元素进行一些精准的操作,需要提前准备一部 Android 设备,激活开发者选项,并在开发者选项中打开 「USB 调试和指针位置」两处设置。

为了确保 adb 命令能正常使用,需要提前配置好 adb 开发环境。

页面元素中的部分元素没法利用 name 等常用属性获取到,可能需要获取到完整的「UI 树」,再利用 Airtest 判断是否存在某个 UI 元素。

# 安装依赖pip3 install pocoui

另外,项目中会对视频进行人脸识别,获取到出现的所有人脸,再进行性别识别及颜值判断。

这里需要进行百度云后台,注册一个人脸识别的应用,获取到一组 「API Key 和 Secret Key」值。

https://console.bce.baidu.com

然后利用官网提供的 API 文档即可获取到「access token」,由于 ak 的有效期为一个月,所以只需要初始化一次,后面就可以利用人脸识别接口进行正常的识别了。

appid = '你注册应用的appid'
api_key = '你注册应用的ak'
secret_key = '你注册应用的sk'

def get_access_token:
"""
其关access_token有效期一般有一个月
"""
# 此变量赋值成自己API Key的值
client_id = api_key

# 此变量赋值成自己Secret Key的值
client_secret = secret_key

auth_url = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + client_id + '&client_secret=' + client_secret

header_dict = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Trident/7.0; rv:11.0) like Gecko',
"Content-Type": "application/json"}

# 请求获取到token的接口
response_at = requests.get(auth_url, headers=header_dict)
json_result = json.loads(response_at.text)
access_token = json_result['access_token']
return access_token

编 写 脚 本

在上面已经配置好了 adb 环境的情况下,可以直接借助 python 中的 os 模块执行 adb 命令打开抖音 App。

# 抖音App的应用包名和初始Activity
package_name = 'com.ss.android.ugc.aweme'
activity_name = 'com.ss.android.ugc.aweme.splash.SplashActivity'

def start_my_app(package_name, activity_name):
"""
打开应用
adb shell am start -n com.tencent.mm/.ui.LauncherUI
:param package_name:
:return:
"""
os.popen('adb shell am start -n %s/%s' % (package_name, activity_name))

接着,我们需要截取当前播放视频的截图到本地。

需要注意的是,抖音视频播放界面包含视频创作者头像、BGM 创作者头像等一些杂乱的元素,可能对人脸识别的结果产生一些误差,所以需要对屏幕截图之后的图像进行「二次裁剪」处理。

def get_screen_shot_part_img(image_name):
"""
获取手机截图的部分内容
:return:
"""
# 截图
os.system("adb shell /system/bin/screencap -p /sdcard/screenshot.jpg")
os.system("adb pull /sdcard/screenshot.jpg %s" % image_name)

# 打开图片
img = Image.open(image_name).convert('RGB')

# 图片的原宽、高(1080*2160)
w, h = img.size

# 截取部分,去掉其头像、其他内容杂乱元素
img = img.crop((0, 0, 900, 1500))

img.thumbnail((int(w / 1.5), int(h / 1.5)))

# 保存到本地
img.save(image_name)

return image_name

现在可以使用百度提供的 API 获取到上面截图的人脸列表。

def parse_face_pic(pic_url, pic_type, access_token):
"""
人脸识别
5秒之内
:param pic_url:
:param pic_type:
:param access_token:
:return:
"""
url_fi = 'https://aip.baidubce.com/rest/2.0/face/v3/detect?access_token=' + access_token

# 调用identify_faces,获取人脸列表
json_faces = identify_faces(pic_url, pic_type, url_fi)

if not json_faces:
print('未识别到人脸')
return None
else:
# 返回所有的人脸
return json_faces

从上述的人脸列表中筛选出性别为女,年龄为 18-30 岁之间,颜值超过 70 的小姐姐。

def analysis_face(face_list):
"""
分析人脸,判断颜值是否达标
18-30之间,女,颜值大于80
:param face_list:识别的脸的列表
:return:
"""
# 是否能找到高颜值的美女
find_belle = False
if face_list:
print('一共识别到%d张人脸,下面开始识别是否有美女~' % len(face_list))
for face in face_list:
# 判断是男、女
if face['gender']['type'] == 'female':
age = face['age']
beauty = face['beauty']

if 18 <= age <= 30 and beauty >= 70:
print('颜值为:%d,及格,满足条件!' % beauty)
find_belle = True
break
else:
print('颜值为:%d,不及格,继续~' % beauty)
continue
else:
print('性别为男,继续~')
continue
else:
print('图片中没有发现人脸.')

return find_belle

由于视频是连续播放的,很难通过截取视频某一帧,判断视频有出现颜值高的小姐姐。

另外,大部分短视频播放时长为「10s+」,这里需要对每一个视频多次截图去做人脸识别,直到识别到颜值高的小姐姐。

# 一条视频最长的识别时间RECOGNITE_TOTAL_TIME = 10 # 识别次数
recognite_count = 1

# 对当前视频截图去人脸识别
while True:
# 获取截图
print('开始第%d次截图' % recognite_count)

# 截取屏幕有用的区域,过滤视频作者的头像、BGM作者的头像
screen_name = get_screen_shot_part_img('images/temp%d.jpg' % recognite_count)

# 人脸识别
recognite_result = analysis_face(parse_face_pic(screen_name, TYPE_IMAGE_LOCAL, access_token))

recognite_count += 1

# 第n次识别结束后的时间
recognite_time_end = datetime.now

# 这一条视频出现了颜值高的小姐姐
if recognite_result:
pass
else:
print('超时!!!这是一条没有吸引力的视频!')
# 跳出里层循环
break

一旦当前播放的视频识别出有颜值高的小姐姐,就需要模拟保存视频到本地的操作。

获取「分享」和「保存本地」两个按钮的坐标位置,依次利用 adb 执行点击操作即可下载视频到本地。

def save_video_met:
"""
:return:
"""
# 分享
os.system("adb shell input tap 1000 1500")
time.sleep(0.05)

# 保存到本地
os.system("adb shell input tap 350 1700")

另外,由于下载视频的过程是一个耗时操作,在下载进度对话框还未消失之前,需要做一个「模拟等待」的操作。

def wait_for_download_finished(poco):
"""
从点击下载,到下载完全
:return:
"""

element = Element
while True:
# 由于是对话框,不能利用Element类来判断是否存在某个元素来准确处理
# element_result = element.findElementByName('正在保存到本地')

# 当前页面UI树元素信息
# 注意:保存的时候可能会获取元素异常,这里需要抛出,并终止循环
# com.netease.open.libpoco.sdk.exceptions.NodeHasBeenRemovedException: Node was no longer alive when query attribute "visible". Please re-select.
try:
ui_tree_content = json.dumps(poco.agent.hierarchy.dump, indent=4).encode('utf-8').decode('unicode_escape')
except Exception as e:
print(e)
print('异常,按下载处理~')
break

if '正在保存到本地' in ui_tree_content:
print('还在下载中~')
time.sleep(0.5)
continue
else:
print('下载完成~')
break

在视频保存到本地之后,就可以模拟向上滑动的操作,跳到播放「下一条视频」。

循环上面的操作,即可筛选出所有颜值高的小姐姐,并保存到本地。

def play_next_video:
"""
下一个视频
从下往上滑动
:return:
"""
os.system("adb shell input swipe 540 1300 540 500 100")

在脚本一条条刷视频的过程中,可能会遇到一下广告,我们需要对这类视频进行过滤。

def is_a_ad:
"""
判断的当前页面上是否是一条广告
:return:
"""
element = Element
ad_tips = ['去玩一下', '去体验', '立即下载']

find_result = False

for ad_tip in ad_tips:
try:
element_result = element.findElementByName(ad_tip)
# 是一条广告,直接跳出
find_result = True
break
except Exception as e:
find_result = False

return find_result

结 果 结 论

运行上面的脚本,会自动打开抖音,对每一条小视频多次进行人脸识别,直到识别到颜值高的小姐姐,保存视频到本地,然后继续刷下一条短视频。

如果你觉得文章还不错,请大家点赞分享下。你的肯定是我最大的鼓励和支持。

相关推荐

驱动网卡(怎么从新驱动网卡)
驱动网卡(怎么从新驱动网卡)

网卡一般是指为电脑主机提供有线无线网络功能的适配器。而网卡驱动指的就是电脑连接识别这些网卡型号的桥梁。网卡只有打上了网卡驱动才能正常使用。并不是说所有的网卡一插到电脑上面就能进行数据传输了,他都需要里面芯片组的驱动文件才能支持他进行数据传输...

2026-01-30 00:37 liuian

win10更新助手装系统(微软win10更新助手)

1、点击首页“系统升级”的按钮,给出弹框,告诉用户需要上传IMEI码才能使用升级服务。同时给出同意和取消按钮。华为手机助手2、点击同意,则进入到“系统升级”功能华为手机助手华为手机助手3、在检测界面,...

windows11专业版密钥最新(windows11专业版激活码永久)

 Windows11专业版的正版密钥,我们是对windows的激活所必备的工具。该密钥我们可以通过微软商城或者通过计算机的硬件供应商去购买获得。获得了windows11专业版的正版密钥后,我...

手机删过的软件恢复(手机删除过的软件怎么恢复)
手机删过的软件恢复(手机删除过的软件怎么恢复)

操作步骤:1、首先,我们需要先打开手机。然后在许多图标中找到带有[文件管理]文本的图标,然后单击“文件管理”进入页面。2、进入页面后,我们将在顶部看到一行文本:手机,最新信息,文档,视频,图片,音乐,收藏,最后是我们正在寻找的[更多],单击...

2026-01-29 23:55 liuian

一键ghost手动备份系统步骤(一键ghost 备份)

  步骤1、首先把装有一键GHOST装系统的U盘插在电脑上,然后打开电脑马上按F2或DEL键入BIOS界面,然后就选择BOOT打USDHDD模式选择好,然后按F10键保存,电脑就会马上重启。  步骤...

怎么创建局域网(怎么创建局域网打游戏)

  1、购买路由器一台。进入路由器把dhcp功能打开  2、购买一台交换机。从路由器lan端口拉出一条网线查到交换机的任意一个端口上。  3、两台以上电脑。从交换机任意端口拉出网线插到电脑上(电脑设置...

精灵驱动器官方下载(精灵驱动手机版下载)

是的。驱动精灵是一款集驱动管理和硬件检测于一体的、专业级的驱动管理和维护工具。驱动精灵为用户提供驱动备份、恢复、安装、删除、在线更新等实用功能。1、全新驱动精灵2012引擎,大幅提升硬件和驱动辨识能力...

一键还原系统步骤(一键还原系统有哪些)

1、首先需要下载安装一下Windows一键还原程序,在安装程序窗口中,点击“下一步”,弹出“用户许可协议”窗口,选择“我同意该许可协议的条款”,并点击“下一步”。  2、在弹出的“准备安装”窗口中,可...

电脑加速器哪个好(电脑加速器哪款好)

我认为pp加速器最好用,飞速土豆太懒,急速酷六根本不工作。pp加速器什么网页都加速,太任劳任怨了!以上是个人观点,具体性能请自己试。ps:我家电脑性能很好。迅游加速盒子是可以加速电脑的。因为有过之...

任何u盘都可以做启动盘吗(u盘必须做成启动盘才能装系统吗)

是的,需要注意,U盘的大小要在4G以上,最好是8G以上,因为启动盘里面需要装系统,内存小的话,不能用来安装系统。内存卡或者U盘或者移动硬盘都可以用来做启动盘安装系统。普通的U盘就可以,不过最好U盘...

u盘怎么恢复文件(u盘文件恢复的方法)

开360安全卫士,点击上面的“功能大全”。点击文件恢复然后点击“数据”下的“文件恢复”功能。选择驱动接着选择需要恢复的驱动,选择接入的U盘。点击开始扫描选好就点击中间的“开始扫描”,开始扫描U盘数据。...

系统虚拟内存太低怎么办(系统虚拟内存占用过高什么原因)

1.检查系统虚拟内存使用情况,如果发现有大量的空闲内存,可以尝试释放一些不必要的进程,以释放内存空间。2.如果系统虚拟内存使用率较高,可以尝试增加系统虚拟内存的大小,以便更多的应用程序可以使用更多...

剪贴板权限设置方法(剪贴板访问权限)
剪贴板权限设置方法(剪贴板访问权限)

1、首先打开iphone手机,触碰并按住单词或图像直到显示选择选项。2、其次,然后选取“拷贝”或“剪贴板”。3、勾选需要的“权限”,最后选择开启,即可完成苹果剪贴板权限设置。仅参考1.打开苹果手机设置按钮,点击【通用】。2.点击【键盘】,再...

2026-01-29 21:37 liuian

平板系统重装大师(平板重装win系统)

如果你的平板开不了机,但可以连接上电脑,那就能好办,楼主下载安装个平板刷机王到你的个人电脑上,然后连接你的平板,平板刷机王会自动识别你的平板,平板刷机王上有你平板的我刷机包,楼主点击下载一个,下载完成...

联想官网售后服务网点(联想官网售后服务热线)

联想3c服务中心是联想旗下的官方售后,是基于互联网O2O模式开发的全新服务平台。可以为终端用户提供多品牌手机、电脑以及其他3C类产品的维修、保养和保险服务。根据客户需求层次,联想服务针对个人及家庭客户...