Docker 部署高性能抖音 TikTok数据爬取工具,支持无水印视频下载
liuian 2025-09-01 08:14 7 浏览
一、项目简介
此项目基于 PyWebIO、FastAPI 和 HTTPX,是一个高效的异步数据爬取工具,专注于抖音/TikTok平台的数据提取。通过Web端界面,用户可以在线批量解析并下载无水印的视频或图集。此外,本项目还提供了数据爬取API和iOS快捷指令,用于无水印内容的下载。您可以选择自行部署或对本项目进行改造,以实现更多功能。在您的项目中,可以直接调用 `scraper.py` 文件,或者通过现有的pip包安装,将其作为解析库来轻松获取数据。
支持功能:
- 网页端批量解析(支持抖音/TikTok混合解析)
- 在线下载视频或图集。
- 制作pip包方便快速导入你的项目
- iOS快捷指令快速调用API实现应用内下载无水印视频/图集
- 完善的API文档(Demo/演示)
- 丰富的API接口:抖音网页版API(视频解析、用户信息、用户视频图片、直播流等),TikTok网页版API(视频解析、用户信息、用户视频图片、直播流等)、哔哩哔哩网页版API(单个视频详细信息、视频流地址、用户视频作品等)
二、安装准备
2.1、Docker 安装
确保当前服务器安装了 Docker,如果没有可以自行安装,也可以直接部署。
# docker 信息
docker info
2.2、Cookie 获取(以抖音为例)
登陆网页版抖音,然后随便进入一个用户的主页,按 F12 打开开发者工具。按照下面步骤:选择 Network -> Fetch/XHR -> 刷新页面 -> 点击 post/? 接口 -> 复制 Cookie 所有的值(有用!)。如下图:
三、Docker 部署
3.1、修改Cookie
因为 douyin 风控的原因,需要替换成自己的 Cookie(而且在cookie失效时需要替换)
# 拉取代码
git clone https://github.com/Evil0ctal/Douyin_TikTok_Download_API.git
# 修改cookie 以抖音为例 (tiktok 目录在 crawler/tiktok )
cd Douyin_TikTok_Download_API/crawlers/douyin/web/
# 编辑 config.yaml
vim config.yaml
# 替换cookie,这个参数后面的替换成刚才获取到的cookie
Cookie: __ac_nonce=06629f03b000ca74fd5d0........
3.2、构建镜像
你可以选择使用 DockerHub 中构建好的镜像,也可以自己构建(推荐,因为要修改配置中的抖音cookie)
# 构建镜像(先安装docker 和 修改Cookie)
docker build -t douyin-tiktok-api:latest .
# 拉取官方镜像
docker pull evil0ctal/douyin_tiktok_download_api:latest
注:如官方镜像拉取失败,请查看这篇文章:国内docker镜像无法访问,通过cloudflare白嫖个人docker镜像加速
3.3、运行容器
# 自己构建的镜像
docker run -itd -p 80:80 --name douyin-tiktok-api --restart=always -v /etc/localtime:/etc/localtime:ro douyin-tiktok-api:latest
# 官方镜像
docker run -itd -p 80:80 --name douyin-tiktok-api --restart=always -v /etc/localtime:/etc/localtime:ro evil0ctal/douyin_tiktok_download_api:latest
3.4、验证容器
- 容器运行检查
docker ps
- 访问地址
# localhost 替换成当前服务器地址
http://localhost:80
# api文档界面
http://localhost:80/docs
3.5、停止和删除容器
# Stop
docker stop douyin-tiktok-api
# Remove
docker rm douyin-tiktok-api
四、Linux 部署
4.1、部署脚本
# 脚本是在Ubuntu 20.04 LTS上测试的,其他系统可能会有问题,如果有问题请自行解决。
wget -O install.sh https://raw.githubusercontent.com/Evil0ctal/Douyin_TikTok_Download_API/main/bash/install.sh && sudo bash install.sh
4.2、启停命令
# 启动
systemctl start Douyin_TikTok_Download_API.service
# 停止
systemctl stop Douyin_TikTok_Download_API.service
4.3、开机自启
# 添加开机自启
systemctl enable Douyin_TikTok_Download_API.service
# 删除开机自启
systemctl disable Douyin_TikTok_Download_API.service
4.4、更新项目
cd /www/wwwroot/Douyin_TikTok_Download_API/bash && sudo bash update.sh
五、测试截图
- 抖音用户信息
- 用户主页视频数据
- 单个视频详情
六、项目地址
- 开源地址
https://github.com/Evil0ctal/Douyin_TikTok_Download_API
- web端体验地址
https://douyin.wtf
- 文档地址
https://douyin.wtf/docs
相关推荐
- C语言学习从内存堆栈视角,给这段枚举代码做个 "内存透视"
-
从内存堆栈视角,给这段枚举代码做个"内存透视"#include<stdio.h>enumDAY{MON=1,TUE,WED,THU,FR...
- Python基础:枚举,都有哪些特点和使用场景呢?
-
在Python编程语言中,枚举(Enumeration)是一种特殊的类,用于为一组常量创建一个名称空间。枚举类在Python3.4中被引入,提供了一种更加直观和方便的方式来处理一组相关的常量。枚举类...
- Java枚举你真的会用吗_java枚举怎么使用
-
概述Java中枚举,大家在项目中经常使用吧,主要用来定义一些固定值,在一个有限的集合内,比如在表示一周的某一天,一年中的四季等。那你了解枚举的本质吗?了解枚举的一些常见用法吗?枚举介绍和使用枚举主要用...
- 反射、枚举以及Lambda表达式_反射getmethod
-
一、反射1.定义Java的反射(reflection)机制是在运行状态中,对于任意一个类,都能够知道这个类的所有属性和方法(即使是私有的);对于任意一个对象,都能够调用它的任意方法和属性,那么,我们就...
- 一个高效使用cursor开发项目的方法,怎么让 AI 写的代码不跑题?
-
最近又用cursor做了一个小应用,番茄时钟,用来管理自己的时间,提高效率。然后使用cursor开发的过程中。有了一些新的感悟。找到了一条可以让Curosr不跑题的办法。生成一份详细的项目资...
- 前端铜九铁十面试必备八股文——工程化
-
常用的git命令gitclone:克隆远程仓库到本地。gitinit:在当前目录初始化一个新的Git仓库。gitadd:将文件添加到暂存区,准备提交。gitcommit-m"co...
- IntelliJ IDEA 2025.2 的主要更新亮点
-
以下是该版本的一些关键改进与功能更新:AI增强体验离线Java代码补全:AI助手现在支持在离线模式下进行Java代码块建议,并允许用户选择本地代码模型使用。AIAssistant新增...
- 一行命令,AI 直接写代码!OpenAI 正式发布 Codex CLI
-
【一句话速读】OpenAI把2021年的Codex品牌复活,推出全新CodexCLI——一个本地运行的轻量级编码代理。只需npmi-g@openai/codex,它就能在终端里帮...
- 如何使用高级TypeScript模式构建可扩展的QA框架
-
TypeScript自动化QA(7部分系列)TypeScript第一步:自动化QA实用路线图如何在TypeScript中使用数组和对象构建强大的QA自动化脚本如何掌握TypeScript基础...
- Bun JS工具包新增MySQL驱动和密钥管理功能
-
Bun团队发布了其JavaScript打包器和运行时的1.2.21版本,该工具使用Zig语言编写,新增了包括MySQL和SQLite内置驱动、YAML解析器以及用于工具和本地开发的密钥管理器等功能。新...
- 编码 10000 个小时后,开发者悟了:“不要急于发布!”
-
【CSDN编者按】在软件开发的道路上,时间是最好的老师。根据“一万小时定律”,要成为某个领域的专家,通常需要大约一万小时的刻意练习。本文作者身为一名程序员,也经历了一万小时的编程,最终悟出了一个道理...
- 一文说明,TypeScript 的装饰器_typescript logo
-
●装饰器(Decorators)●注意:装饰器目前是一项实验性特性,在未来的版本中可能会发生改变●装饰器一般使用在以下几个地方○类○类属性○类方法○类方法的参数○通过这些我们也能看得出来,...
- 前端小哥哥:如何使用typescript开发实战项目?
-
前言笔者上一篇文章:主要写了typescript的用法和核心知识点总结,这篇文章将通过一个实际的前端案例来教大家如何在项目中使用typescript.你将收获如何使用umi快速搭建一个基于React...
- 一篇文章搞懂TypeScript_typescript implements
-
TypeScript是JavaScript的超集,一方面给动态类型的js增加了类型校验,另一方面扩展了js的各种功能。原始数据类型字符串数值布尔nullundefinedSymbolBi...
- TypeScript的any和unknown,用错一个就是线上Bug
-
在TypeScript开发中,类型系统是我们抵御运行时错误的第一道防线。但两个特殊类型——any和unknown,却常常被误用,成为线上故障的隐形推手。本文通过真实案例解析,告诉你为什么unknown...
- 一周热门
-
-
【验证码逆向专栏】vaptcha 手势验证码逆向分析
-
Python实现人事自动打卡,再也不会被批评
-
Psutil + Flask + Pyecharts + Bootstrap 开发动态可视化系统监控
-
一个解决支持HTML/CSS/JS网页转PDF(高质量)的终极解决方案
-
再见Swagger UI 国人开源了一款超好用的 API 文档生成框架,真香
-
网页转成pdf文件的经验分享 网页转成pdf文件的经验分享怎么弄
-
C++ std::vector 简介
-
飞牛OS入门安装遇到问题,如何解决?
-
系统C盘清理:微信PC端文件清理,扩大C盘可用空间步骤
-
10款高性能NAS丨双十一必看,轻松搞定虚拟机、Docker、软路由
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)