Python JSON数据处理全攻略:从入门到实战,新手也能轻松掌握!
liuian 2025-04-11 00:58 118 浏览
引言
在当今数据驱动的时代,JSON(JavaScript Object Notation)已成为互联网数据交换的“通用语言”。无论是API接口、配置文件还是网络爬虫,JSON都扮演着核心角色。本文将通过零基础手把手教学+实战案例,带你掌握Python处理JSON的核心技巧,并附赠今日头条数据抓取实战代码,助你快速进阶!
一、JSON基础:为什么每个程序员都必须掌握?
JSON是一种轻量级的数据格式,具有以下优势:
- 易读性:键值对结构清晰,如{"name": "张三", "age": 25};
- 跨平台性:支持Python、Java、JavaScript等多种语言;
- 高效传输:体积小,解析速度快,适合网络传输。
JSON常见格式示例:
{
"用户": [
{"name": "张三", "hobbies": ["篮球", "编程"]},
{"name": "李四", "email": "lisi@example.com"}
]
}二、Python操作JSON的四大核心函数
函数 | 作用 | 场景 |
json.dumps() | 将Python对象转为JSON字符串 | 数据序列化 |
json.loads() | 将JSON字符串转为Python对象 | 数据反序列化 |
json.dump() | 将Python对象写入JSON文件 | 文件存储 |
json.load() | 从JSON文件读取数据到Python对象 | 文件读取 |
代码示例:数据转换与文件读写
import json
# 数据转JSON字符串
data = {"platform": "今日头条", "users": [{"name": "小王", "粉丝数": 10000}]}
json_str = json.dumps(data, indent=4) # indent参数让JSON格式化排版
print("JSON字符串:\n", json_str)
# 写入JSON文件
with open('data.json', 'w', encoding='utf-8') as f:
json.dump(data, f, ensure_ascii=False) # 确保中文正常显示
# 从文件读取
with open('data.json', 'r') as f:
loaded_data = json.load(f)
print("读取到的数据:", loaded_data)三、实战案例:抓取今日头条热门文章数据(附完整代码)
步骤1:安装依赖库
pip install requests步骤2:发送请求并解析JSON
import requests
import json
def fetch_toutiao_hot():
url = "https://www.toutiao.com/api/pc/list/feed?channel_id=3189398972" # 娱乐频道接口
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
}
response = requests.get(url, headers=headers)
if response.status_code == 200:
data = json.loads(response.text)
for article in data.get('data', []):
title = article.get('title', '无标题')
read_count = article.get('read_count', 0)
print(f"标题: {title} | 阅读量: {read_count}")
else:
print("请求失败,状态码:", response.status_code)
fetch_toutiao_hot()代码解析:
- 使用requests库模拟浏览器请求,绕过简单反爬机制;
- json.loads()解析返回的JSON数据,提取标题和阅读量;
- 关键点:需添加User-Agent请求头,否则可能被服务器拒绝。
四、进阶技巧:处理复杂JSON结构
- 嵌套数据提取
若JSON数据多层嵌套,可通过递归或逐层访问:
# 示例:提取所有用户的兴趣标签
data = {
"department": {
"name": "技术部",
"members": [
{"name": "张三", "tags": ["Python", "AI"]},
{"name": "李四", "tags": ["Java", "大数据"]}
]
}
}
all_tags = [tag for member in data['department']['members'] for tag in member['tags']]
print("所有兴趣标签:", all_tags) # 输出: ['Python', 'AI', 'Java', '大数据']- 数据格式化与排序
data = {"b": 2, "a": 1, "c": 3}
formatted_json = json.dumps(data, indent=2, sort_keys=True)
print(formatted_json)
# 输出按键名排序的格式化JSON五、避坑指南:新手常见问题
- 编码问题:使用ensure_ascii=False参数避免中文乱码;
- 文件路径错误:建议使用绝对路径或检查文件权限;
- 数据类型不匹配:JSON的null对应Python的None,true/false对应True/False。
结语
通过本文,你已掌握从基础操作到实战应用的完整JSON处理技能。无论是本地数据存储,还是网络数据抓取,JSON都是Python程序员不可或缺的工具。立即动手运行示例代码,探索更多数据处理的可能!
今日头条原创提示:本文代码经过实测,转载请注明出处。关注作者,获取更多Python爬虫与数据分析实战技巧!
相关推荐
- 路由器和猫图片(路由器和猫图片怎么连接)
-
因为光猫是光电转换设备,没有光猫不能把光信号转换成网络宽带信号,而路由器是将宽带信号转换成更容易连接使用的网络。两个配合使用还可以增加无线网络,有限网络路数。相当于扩大了宽带的使用范围,宽带上网比较麻...
- 安装惠普打印机驱动程序(怎么免费安装惠普打印机驱动程序)
-
安装具体操作步骤如下:一、下载驱动程序进行安装。(安装驱动程序前,不要连接打印机USB连接线。)二、在“许可协议”窗口中,选择“我接受许可协议的条款”选项,然后点击“下一步”按钮。三、驱动程序开始...
- u盘电脑重做系统步骤(电脑用u盘重做系统)
-
以下是电脑u盘重装系统的教程:1.下载所需的操作系统镜像文件,例如windows10。确保您选择了与您的计算机兼容的版本,并将其保存到您的计算机上。2.准备一个空的u盘。请注意,此过程将格式化u...
- 没有光驱的笔记本怎么看光盘
-
1、接外置光驱。将外置光驱与笔记本连接,使笔记本实现光驱功能,即可查看光盘。2、用有光驱的电脑将光盘内容拷到电脑上,再使用U盘或者移动硬盘将内容拷到笔记本上,或使用网络连接共享,即可查看光盘。 某些...
- win10激活码永久(win10激活码最新)
-
1、使用Windows+R组合快捷键打开运行命令框运行:slmgr.vbs-dlv命令可以查询到Win10的激活信息,包括:激活ID、安装ID、激活截止日期等信息。2、运行:slmgr...
- 北京科兴的疫苗怎么回事(北京科兴的疫苗是什么疫苗)
-
不是一家公司的,因为北京科兴生物科技有限公司和长春生物科技有限公司都是生产疫苗的公司,但是不是属于同一家公司的科兴来自中国。全称北京科兴生物制品有限公司,是中国第一家在美上市的疫苗企业,北京科兴建有专...
- 页眉横线一直删除不了(页眉横线一直删除不了 如何删除)
-
一、页眉横线的本质——边框双击页眉把光标定位到页眉的文字中,“开始”→“样式”→“样式检查器”→“显示格式”(勾选底部的“显示所有格式标记”)→往下移右边的滑块到“边框”,“边框”下的“底端:(单实线...
- 分区助手分区教程(分区助手如何操作)
-
以老毛桃启动盘中的分区助手为例,使用步骤如下(调整分区大小):1、在主菜单界面用键盘方向键“↓”将光标移至“【02】运行老毛桃Win8PE防蓝屏版(新电脑)”,回车确定;2、鼠标点击开始图标,选择分区...
- 做启动盘用什么软件好(做启动盘的工具)
-
制作软件下载后,安装。运行是时候就有提示插入u盘。然后点击一键制作即可。至于工具哪个好,个人使用的熟悉度来决定,u盘系统盘制作工具功能几乎一样。
- qq对战平台老版本(qq对战平台在qq哪里)
-
1.打开任务管理器-进程。查找是否有cstrike.exe或hl.exe(CS名字.exe)。如果有的话。请点击结束进程。再试试。2.打开任务管理器-进程。查找是否有QQPet.exe(QQ宠物进...
- 电脑开机无限自动重启(电脑开机后自动重启无数遍是什么原因)
-
依次打开开始控制面板,打开系统安全系统,找到高级系统设置并打开,进入系统属性选择高级,找到启动和故障恢复点击设置,在弹出页面找到系统失败自动重新启动取消勾选并启动。2.键盘按住win+r打开运行框,...
- ghostxp32位下载(ghost win7下载32位)
-
你不需要直接加4G的,你再买一条2G同品牌型号内存加上去,组成4G内存就行,不过系统要改为Win764位系统,因为XP只能认3.25G内存,如果你想下载圣安地列斯游戏,并且使用的系统是Window...
- eset nod32 24位激活码(eset激活码生成器)
-
ESETNOD32Antivirus4的激活码是24位的例如M26D-0233-4W9Q-VSSB-D84G-JJJJ或V26D-0243-4W9Q-VSSB-D84G-JGFD(友情提示...
- 一周热门
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
