百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

Python JSON 魔法手册:数据转换的终极艺术

liuian 2025-05-10 23:19 44 浏览


对话实录

小白:(崩溃)我从 API 拿到了 JSON 数据,怎么变成 Python 对象?

专家:(掏出魔法书)用 json 模块,轻松实现数据转换


JSON 基础三连击

1. 字符串 <-> Python 对象

import json
# JSON字符串 → Python对象
data = json.loads('{"name": "小明", "age": 18}')
print(data["name"]) # → 小明

# Python对象 → JSON字符串
json_str = json.dumps({"name": "小红", "age": 16})
print(json_str) # → {"name": "小红", "age": 16}

专家提醒:json.loads()的's'代表string!这就好比在数据的 “翻译” 过程中,loads专门负责把JSON格式的字符串 “翻译” 成Python 能识别的对象;与之相对,dumps则把Python对象“翻译”成JSON字符串。

2. 文件 <-> Python 对象

# 读取JSON文件
with open("data.json", encoding="utf-8") as f:
   data = json.load(f)

# 写入JSON文件
with open("output.json", "w", encoding="utf-8") as f:
   json.dump(data, f, ensure_ascii=False, indent=2)

在 JSON 文件的处理过程中,json.load与json.dump就像一对默契的搬运工,前者将文件中的JSON 数据搬进Python 程序,后者则把Python对象数据搬运到文件中存储。

3.json数据和python数据类型对照表

json字符串和python数据转换的对照表如下

JSON

Python

object

dict

array

list、tuple

string

unicode、str

number (int)

int, long

number (real)

float

true

True

false

False

null

None

六大实战案例

案例 1:处理 API 响应

import requests
response = requests.get("https://api.example.com/data")
data = response.json() # 直接获取Python对象
print(data["results"][0])

当我们从 API 获取数据时,response.json()就像一把万能钥匙,轻松将 API 返回的 JSON 数据转换成 Python 对象,方便我们进一步处理数据。

案例 2:自定义对象序列化

class User:
  def __init__(self, name, age):
   self.name = name
   self.age = age

	# 自定义编码器
  def user_encoder(obj):
      if isinstance(obj, User):
          return {"name": obj.name, "age": obj.age}
      raise TypeError

user = User("小明", 18)
json_str = json.dumps(user, default=user_encoder)

在处理自定义类对象时,默认的 JSON 序列化方法会 “不知所措”。这时,我们自定义的user_encoder函数就像一位 “特殊翻译”,指导json.dumps如何将User对象转换成 JSON 格式,让数据能顺利在不同场景中流转。

案例 3:处理复杂数据类型

from datetime import datetime
from decimal import Decimal
import json
data = {
 "time": datetime.now(),
 "price": Decimal("99.99")
}

# 自定义序列化
def custom_encoder(obj):
    if isinstance(obj, datetime):
        return obj.isoformat()
    if isinstance(obj, Decimal):
        return float(obj)
    raise TypeError

json_str = json.dumps(data, default=custom_encoder)
print(json_str)

datetime和Decimal这类复杂数据类型,无法被 JSON 直接处理。通过自定义的custom_encoder,我们将datetime对象转换成 ISO 格式字符串,将Decimal对象转换成float类型,从而突破 JSON 序列化的限制,让数据准确无误地进行转换和存储。

案例 4:多文件数据整合

import json

file_list = ["file1.json", "file2.json", "file3.json"]
combined_data = []
for file in file_list:
    with open(file, encoding="utf-8") as f:
        data = json.load(f)
        combined_data.extend(data)
with open("combined.json", "w", encoding="utf-8") as f:
    json.dump(combined_data, f, ensure_ascii=False, indent=2)

在项目开发中,常常需要整合多个 JSON 文件的数据。这段代码通过循环读取多个文件,将数据合并到一个列表中,再将整合后的数据写入新的 JSON 文件,实现了数据的高效汇总与管理。

案例 5:数据过滤与清洗

with open("raw_data.json", encoding="utf-8") as f:
	data = json.load(f)
	filtered_data = [item for item in data if item["status"] == "active"]

with open("filtered_data.json", "w", encoding="utf-8") as f:
	json.dump(filtered_data, f, ensure_ascii=False, indent=2)


当数据量庞大且包含无效或错误信息时,数据过滤与清洗至关重要。此代码从原始 JSON 数据中筛选出状态为 “active” 的条目,去除无效数据,生成更精准、可用的数据集,为后续分析和应用提供保障。

案例 6:实时数据更新

with open("data.json", "r+", encoding="utf-8") as f:
	data = json.load(f)
 	data["count"] = data.get("count", 0) + 1
 	f.seek(0)
 	json.dump(data, f, ensure_ascii=False, indent=2)
 	f.truncate()


在一些需要实时记录数据变化的场景,如计数器、日志记录等,这段代码实现了对 JSON 文件数据的实时更新。通过读取文件数据、修改数据、再写回文件的操作,确保数据的时效性和准确性。

血泪陷阱

编码问题

# 错误示范
json.dumps({"name": "小明"}) # → {"name": "\u5c0f\u660e"}
# 正确做法
json.dumps({"name": "小明"}, ensure_ascii=False)

默认情况下,json.dumps会将非 ASCII 字符转义为 Unicode 编码。添加ensure_ascii=False参数,就可以让中文字符正常显示,避免乱码问题,确保数据在传输和展示过程中的准确性。

循环引用

data = {"a": 1}
data["b"] = data # 循环引用
# 错误示范
json.dumps(data) #  ValueError

# 解决方案
from json import JSONEncoder
class MyEncoder(JSONEncoder):
 def default(self, obj):
 	# 处理循环引用
 	return str(obj)

当数据结构中存在循环引1用时,json.dumps会抛出ValueError。通过自定义JSONEncoder,我们可以对循环引用的对象进行特殊处理,如将其转换成字符串,从而避免程序崩溃。

日期时间处理

# 错误示范
json.dumps({"time": datetime.now()}) #  TypeError

# 正确做法
json.dumps({"time": datetime.now().isoformat()})

由于 JSON 本身不支持datetime类型,直接对包含datetime对象的数据进行序列化会导致TypeError。将datetime对象转换成 ISO 格式字符串,是一种简单有效的解决方案,确保日期时间数据能顺利进行 JSON 转换。

专家工具箱

json.dump和json.dumps函数的参数介绍

这两个函数的一些参数配置可使转换后的json数据更美观更容易阅读

默认的参数如下:
skipkeys=False, ensure_ascii=True, check_circular=True,
allow_nan=True, cls=None, indent=None, separators=None,
default=None, sort_keys=False
  • sort_keys参数(排序

如果传入sort_keys为True,转换为json时讲按照传入的字典进行排序。

python_dictinfo = { 'name': 'lili', 'age': 20}
json_data = json.dumps(python_dictinfo,sort_keys=True)
print(f'转换后的json数据: {json_data}')

#打印排序后的结果 
转换后的json数据: {"age": 20, "name": "lili"}
  • indent参数(美化输出

indent传入的是非负整数,则JSON数组元素和对象成员将使用该缩进进行漂亮的打印

python_dictinfo = {"name":"lili","age":20.00,"address":["china","js","nj"],"man":True,"woman":False,"money":None}
json_data = json.dumps(python_dictinfo,indent=4)
print(f'转换后的json数据: {json_data}')
转换后的json数据: 
{
"name": "lili",
"age": 20.0,
"address": [
       "china",
       "js",
       "nj"
           ],
"man": true,
"woman": false,
"money": null
}
  • separators参数

表示“分隔符”,默认值为(',',':'),如果指定为其他的元组,比如('a','b'),意味着原来的逗号会被替换为a,原来的冒号会被替换为b,并去掉后面的空格。

python_dictinfo = python_dictinfo = { 'name': 'lili', 'age': 20}
json_data = json.dumps(python_dictinfo,separators=('a','b'))
print(f'转换后的json数据: {json_data}')
#打印结果
转换后的json数据: {"name"b"lili"a"age"b20}
  • skipkeys参数

默认值是False,如果“skipkeys”为True,则非python基本数据类型的“dict”键

(“str”、“int”、“float”、“bool”、“None”),将被跳过而不会引发“TypeError”。

#定义一个元组的键
python_dictinfo = {'name': 'lili', 'age': 20, ('china', 'js', 'nj'): None}
json_data = json.dumps(python_dictinfo)
print(f'转换后的json数据: {json_data}')
#执行后报错
TypeError: keys must be str, int, float, bool or None, not tuple
添加参数skipkeys=True 
json_data = json.dumps(python_dictinfo,skipkeys=True)
print(f'转换后的json数据: {json_data}')
#打印结果 会忽略掉元组键值
转换后的json数据: {"name": "lili", "age": 20}
  • ensure_ascii参数(支持中文

默认值True,输出ASCLL码,如果配置为False,可以输出中文。

python_dictinfo = {'name': '王磊', 'age': 20 }
json_data = json.dumps(python_dictinfo)
print(f'转换后的json数据: {json_data}')
#结果如下
转换后的json数据: {"name": "\u738b\u78ca", "age": 20}

配置为False后可打印中文

json_data = json.dumps(python_dictinfo,ensure_ascii=False)
print(f'转换后的json数据: {json_data}')
#结果如下
转换后的json数据: {"name": "王磊", "age":20}
  • check_circular参数

如果check_circular为false,则跳过对容器类型的循环引用检查,循环引用将导致溢出错误(或更糟的情况)。

  • allow_nan参数

默认为True,序列化超出范围的浮点值(nan、inf、-inf)转为json格式 (nan、Infinity、-Infinity)。如果为False,则执行时会报错。

python_dictinfo = {'name': 'lili', 'age': float('inf')}
json_data = json.dumps(python_dictinfo,allow_nan=False)
# allow_nan=False 则执行时会报错
ValueError: Out of range float values are not JSON compliant: inf

小白:(献上膝盖)原来 JSON 处理这么强大!

专家:(扶起小白)记住:JSON 是数据交换的通用语言,掌握它走遍天下都不怕!

相关推荐

华硕如何进入u盘启动(华硕电脑如何进入u盘启动)

您好!华硕笔记本的启动项设置,一般有两种。1,插上U盘,开机按ESC键,可以快速进入到启动项。2,开机按F2进入BIOS-boot项,可以设置启动项。通常建议第一个方式,比较简单方便,BIOS如果更该...

手机安装打印机的方法和步骤

无论手机还是电脑,连接打印机都需要驱动的。一般来说,支持手机的打印机并不多,如果你想通过手机连接打印机,只需要购买支持手机系统的打印机就行,这并不是一个软件就可以解决的问题。但还有一个方法,可以让手机...

uc浏览器app官方下载(uc浏览器官方网)
uc浏览器app官方下载(uc浏览器官方网)

1、首先打开手机,在手机桌面上找到自己手机应用商店,然后点击进入。2、进入到应用商店界面中,在应用商店中搜索uc浏览器下载即可。3、安装后便会出现在桌面上。UC浏览器(UCBrowser)是UCMobileLimited在2004年8...

2025-12-27 01:05 liuian

ipad冬天充不进电(天冷ipad充不进电)
  • ipad冬天充不进电(天冷ipad充不进电)
  • ipad冬天充不进电(天冷ipad充不进电)
  • ipad冬天充不进电(天冷ipad充不进电)
  • ipad冬天充不进电(天冷ipad充不进电)
32位office2010下载(32位office2013)
32位office2010下载(32位office2013)

1、先下载office2010完整安装包免费版。2、最开始安装的时候,需要借助一款微软专用清理工具:msiclear。下载软件后双击msicuu2.exe运行软件。3、运行msicuu2.exe后发现桌面没有快捷方式,在窗口-所有程序中...

2025-12-27 00:05 liuian

台式电脑如何设置定时关机时间

设置电脑指定时间自动关机的方法有两种:方法一:点击电脑屏幕左下角的【开始】按钮,并搜索【计划任务】。点击进入【计划任务】页面中,并选择【创建基本任务】。在创建基本任务的页面中输入【名称】和【描述】,点...

台式键盘fn键在哪里(键盘上找不到fn键)

错误。原因是大部分台式电脑的键盘上都有fn键,虽然fn键通常不像笔记本电脑一样与其他按键组合使用,但它可以单独使用来调节音量、屏幕亮度等功能。fn键起源于笔记本电脑,它的功能键组合可以帮助使用者快速地...

fast无线路由器设置步骤图解
  • fast无线路由器设置步骤图解
  • fast无线路由器设置步骤图解
  • fast无线路由器设置步骤图解
  • fast无线路由器设置步骤图解
怎么用手机控制家里的wifi(怎么用手机控制家里的wifi不让孩子看电视)

以华为手机P40,EMUI10系统为例,如果想要用手机控制wifi的连接设备,就需要先拥有WiFi设备的管理员密码,用手机控制wifi的连接设备有下列几个步骤:1、需要使用手机下载路由器对应的app,...

外接移动硬盘在电脑上不显示怎么办

答:外接硬盘不显示在我的电脑,这种情况一般是因为USB供电不足导致的,如将移动硬盘用USB连接线连接电脑机箱前置面板,将移动硬盘USB线2个USB插头都插上前面板的USB接口。如果是接机箱后主板USB...

bootice修复win10(bootice修复uefi引导)

制作个PE,然后进入PE修复引导即可,具体操作方法:1、首先准备一个制作好的U盘装机大师U盘启动盘,然后连接好电脑与U盘启动盘。重启电脑,在开机画面出现时按下启动快捷键,选择U盘启动,然后就进入了U盘...

手机自带软件怎么卸载(vivo手机自带软件怎么卸载)

答:卸载手机自带应用的方法步骤如下:1.通过应用程序管理器卸载:转到手机的设置菜单,然后找到并点击“应用”或“应用程序管理器”等选项(依据不同品牌和型号手机可能略有差异)。在应用程序列表中,浏览并找...

微信可以设置主题皮肤吗(微信可以设置主题嘛)
  • 微信可以设置主题皮肤吗(微信可以设置主题嘛)
  • 微信可以设置主题皮肤吗(微信可以设置主题嘛)
  • 微信可以设置主题皮肤吗(微信可以设置主题嘛)
  • 微信可以设置主题皮肤吗(微信可以设置主题嘛)
3dmax电脑配置要求(3dmax电脑配置要求i5还是i7)

以下是3dsMax2021的最低系统要求:-操作系统:Windows10(64位)-处理器:64位Intel或AMD多核处理器-内存:至少需要16GBRAM,建议32GBRAM-...

声卡驱动需要更新吗(声卡驱动更新好还是不更好)

  如果声卡使用正常,就不建议无谓地更新驱动。只有在声卡工作异常时,才首先进行驱动的更新。  驱动程序的更新,很多时候是为了支持更多新发布的产品,或者修复已知的问题。当硬件本身工作正常的时候,其实没有...