Python JSON数据处理全攻略:从入门到实战,新手也能轻松掌握!
liuian 2025-04-11 00:58 108 浏览
引言
在当今数据驱动的时代,JSON(JavaScript Object Notation)已成为互联网数据交换的“通用语言”。无论是API接口、配置文件还是网络爬虫,JSON都扮演着核心角色。本文将通过零基础手把手教学+实战案例,带你掌握Python处理JSON的核心技巧,并附赠今日头条数据抓取实战代码,助你快速进阶!
一、JSON基础:为什么每个程序员都必须掌握?
JSON是一种轻量级的数据格式,具有以下优势:
- 易读性:键值对结构清晰,如{"name": "张三", "age": 25};
- 跨平台性:支持Python、Java、JavaScript等多种语言;
- 高效传输:体积小,解析速度快,适合网络传输。
JSON常见格式示例:
{
"用户": [
{"name": "张三", "hobbies": ["篮球", "编程"]},
{"name": "李四", "email": "lisi@example.com"}
]
}二、Python操作JSON的四大核心函数
函数 | 作用 | 场景 |
json.dumps() | 将Python对象转为JSON字符串 | 数据序列化 |
json.loads() | 将JSON字符串转为Python对象 | 数据反序列化 |
json.dump() | 将Python对象写入JSON文件 | 文件存储 |
json.load() | 从JSON文件读取数据到Python对象 | 文件读取 |
代码示例:数据转换与文件读写
import json
# 数据转JSON字符串
data = {"platform": "今日头条", "users": [{"name": "小王", "粉丝数": 10000}]}
json_str = json.dumps(data, indent=4) # indent参数让JSON格式化排版
print("JSON字符串:\n", json_str)
# 写入JSON文件
with open('data.json', 'w', encoding='utf-8') as f:
json.dump(data, f, ensure_ascii=False) # 确保中文正常显示
# 从文件读取
with open('data.json', 'r') as f:
loaded_data = json.load(f)
print("读取到的数据:", loaded_data)三、实战案例:抓取今日头条热门文章数据(附完整代码)
步骤1:安装依赖库
pip install requests步骤2:发送请求并解析JSON
import requests
import json
def fetch_toutiao_hot():
url = "https://www.toutiao.com/api/pc/list/feed?channel_id=3189398972" # 娱乐频道接口
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
}
response = requests.get(url, headers=headers)
if response.status_code == 200:
data = json.loads(response.text)
for article in data.get('data', []):
title = article.get('title', '无标题')
read_count = article.get('read_count', 0)
print(f"标题: {title} | 阅读量: {read_count}")
else:
print("请求失败,状态码:", response.status_code)
fetch_toutiao_hot()代码解析:
- 使用requests库模拟浏览器请求,绕过简单反爬机制;
- json.loads()解析返回的JSON数据,提取标题和阅读量;
- 关键点:需添加User-Agent请求头,否则可能被服务器拒绝。
四、进阶技巧:处理复杂JSON结构
- 嵌套数据提取
若JSON数据多层嵌套,可通过递归或逐层访问:
# 示例:提取所有用户的兴趣标签
data = {
"department": {
"name": "技术部",
"members": [
{"name": "张三", "tags": ["Python", "AI"]},
{"name": "李四", "tags": ["Java", "大数据"]}
]
}
}
all_tags = [tag for member in data['department']['members'] for tag in member['tags']]
print("所有兴趣标签:", all_tags) # 输出: ['Python', 'AI', 'Java', '大数据']- 数据格式化与排序
data = {"b": 2, "a": 1, "c": 3}
formatted_json = json.dumps(data, indent=2, sort_keys=True)
print(formatted_json)
# 输出按键名排序的格式化JSON五、避坑指南:新手常见问题
- 编码问题:使用ensure_ascii=False参数避免中文乱码;
- 文件路径错误:建议使用绝对路径或检查文件权限;
- 数据类型不匹配:JSON的null对应Python的None,true/false对应True/False。
结语
通过本文,你已掌握从基础操作到实战应用的完整JSON处理技能。无论是本地数据存储,还是网络数据抓取,JSON都是Python程序员不可或缺的工具。立即动手运行示例代码,探索更多数据处理的可能!
今日头条原创提示:本文代码经过实测,转载请注明出处。关注作者,获取更多Python爬虫与数据分析实战技巧!
相关推荐
- 手机变电脑桌面免费版(手机秒变电脑桌面下载破解版免费)
-
方法一、无需特别硬件,PC开热点手机连上即可投影,支持用PC的键鼠控制设备,如果是用来演示的话,这是解决方案之一。方法二、类似投影仪的原理这个需要设备制造商提供例如HDMI的输出支持,Android代...
- 惠普打印机墨盒怎么加墨水(惠普2622打印机怎么换墨盒)
-
惠普墨盒加墨水的步骤如下:确保墨盒已加满,取下墨盒。准备一张干净的纸,将墨盒放在上面。注意每个墨盒的顶上贴着一张胶纸,一般胶纸下面就会有注入墨水的孔。小心加墨一次挤入不能太多。如果打印墨色浅,可以在设...
- tplink无线路由器桥接教程(tplink路由器如何进行无线桥接)
-
步骤1:将扩展路由器插电源,不要插网线。步骤2:看易展路由器底部标签的SSID,打开手机的wifi设置,搜索这个wifi信号步骤3:链接上易展路由器的wifi信号步骤4:进入设置界面,部分手机可以自动...
- 怎样还原电脑原来的系统(咋样还原电脑系统)
-
首先,我们必须确保打开系统还原,否则无法恢复操作系统。在确保已打开的情况下,单击菜单,选择“附件”,点系统工具,并还原系统。接下来,打开系统还原,找到系统还原点,找到最佳适合系统还原的时间点,但确保系...
- 惠普服务中心电话(孚惠教育退费服务中心电话)
-
百脑汇里有两家鸿鹄的店面,电话分别是85133339/88609104
- win7装xp怎么装系统(windows7装xp)
-
Windows7和WindowsXP是两个不同的操作系统。但是安装的方法是相同的。第1种就是用安装盘。放入光驱以后。设置启动项以光驱优先,重启电脑,安装光盘,自动引导,按照提示一步一步的就可以安装...
- 磁盘不相邻怎么扩展卷(磁盘分区不相邻)
-
要扩展不相邻的磁盘,可以使用磁盘扩展技术,如磁盘阵列(RD)或逻辑卷管理(LVM)。RAID可以将多个磁盘组合成一个逻辑卷,提供更大的存储空间。LVM允许将多个物理卷组合成一个逻辑卷组,并在其中创建逻...
- cad2018永久激活密钥(cad 2018激活)
-
1、首先打开未激活的CAD软件,点击输入序列号。2、选择我同意后进入下一步。然后再点击界面右下角的激活。3、然后输入序列号:666-69696969和产品密钥:001J1。4、然后在界面内点选选择...
- 文件管理应用(文件管理应用同意怎么设置)
-
推荐文件极客App,免费下载,无广告无内购,功能强大。文件极客app是一款强大的本地、网络文件、iCloud文件共享管理专家,专注于iOS文件一体化管理。在文件极客里面,我们可以通过简单的拖动操作...
- ghost64下载(ghost64下载)
-
方法/步骤分步阅读1/4登陆账号首先进入AppStore,然后登陆美区id账号。2/4搜索点击顶部的搜索栏进入搜索页面。3/4查找结果在搜索结果中找到theghost,点击进入详情页面。4/4下载安...
- 一般家庭买什么电脑好(不懂电脑的人建议买联想吗)
-
家庭在使用电脑时,要根据自己的需求来选择电脑。目前电脑主要有两种,一种是笔记本,一种是台式机。1、如果是经常出门办公,比如经常出差需要带电脑,作为家庭在选择电脑时,这时由于自己经常出差带电脑,就要选择...
- 云电脑软件哪个好用(云电脑好用的)
-
达龙云电脑在网络环境良好的情况下,操作起来非常流畅。另外,延迟也不高,这点因该说云电脑控制的非常好。云电脑还支持移动设备,安卓、IOS平台都得到了支持。玩家们可以通过在手机端连接云电脑之后就能在手机上...
- 笔记本电脑如何连接无线wifi
-
要连接笔记本电脑到WiFi,首先确保你的笔记本电脑有无线网卡,并且WiFi已经开启。在电脑桌面右下角的WiFi图标处点击鼠标右键,选择“打开网络和Internet设置”,然后点击“WiFi”,在可用网...
- gho文件安装win10系统方法(gho文件怎么重装系统)
-
不建议这么操作,如果真的要复制,也是很麻烦的,首先要删除win10里面所有的驱动,注意是所有的,然后关机,注意不能重启进入系统,否则又要重新再来,其次找个U盘pe启动盘或者启动光盘,在开机进入pe系统...
- 一周热门
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
