百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

Pytorch学习-day7: 复习与实践(pytorch入门教程(非常详细))

liuian 2025-05-08 19:41 18 浏览

学习内容

  1. 张量基础回顾: 张量的创建、属性(形状、数据类型、设备)和操作(索引、切片、变形)。 张量的数学运算(加、减、乘、矩阵乘法)和自动求导(requires_grad)。 张量与 NumPy 的互操作。
  2. 神经网络基础回顾: 神经网络的结构:输入层、隐藏层、输出层。 激活函数(如 ReLU、Sigmoid)的用途。 损失函数(如均方误差 MSE)和优化器(如 SGD、Adam)。 前向传播和反向传播的过程。
  3. PyTorch 核心模块: torch.Tensor:张量操作。 torch.nn:构建神经网络(如 nn.Linear、nn.MSELoss)。 torch.optim:优化器。

任务

使用 PyTorch 的 MLP 拟合一个简单线性数据集 y = 2x + 1,并计算均方误差损失。具体要求:

  1. 生成一个简单数据集(如 x 从 -10 到 10,y = 2x + 1 加少量噪声)。
  2. 定义一个 MLP 模型,包含至少一个隐藏层,使用 ReLU 激活函数。
  3. 使用均方误差(MSE)作为损失函数,Adam 优化器进行训练。
  4. 训练模型 100 个 epoch,打印每 10 个 epoch 的损失。
  5. 可视化原始数据点和模型预测的拟合直线。

示例代码

以下代码可在 Google Colab 上运行,用于完成任务:

python

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import matplotlib.pyplot as plt

# 设置随机种子以确保可重复性
torch.manual_seed(42)

# 1. 生成数据集
x = torch.linspace(-10, 10, 100).reshape(-1, 1)  # 输入 x,形状 (100, 1)
y = 2 * x + 1 + torch.randn(x.size()) * 0.5    # y = 2x + 1 + 噪声

# 2. 定义 MLP 模型
class MLP(nn.Module):
    def __init__(self):
        super(MLP, self).__init__()
        self.layers = nn.Sequential(
            nn.Linear(1, 16),  # 输入层到隐藏层(16个神经元)
            nn.ReLU(),         # ReLU 激活函数
            nn.Linear(16, 1)   # 隐藏层到输出层
        )

    def forward(self, x):
        return self.layers(x)

# 实例化模型、损失函数和优化器
model = MLP()
criterion = nn.MSELoss()  # 均方误差损失
optimizer = optim.Adam(model.parameters(), lr=0.01)

# 3. 训练模型
num_epochs = 100
losses = []

for epoch in range(num_epochs):
    # 前向传播
    outputs = model(x)
    loss = criterion(outputs, y)

    # 反向传播和优化
    optimizer.zero_grad()  # 清空梯度
    loss.backward()        # 计算梯度
    optimizer.step()       # 更新参数

    # 记录损失
    losses.append(loss.item())

    # 每 10 个 epoch 打印损失
    if (epoch + 1) % 10 == 0:
        print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}')

# 4. 可视化结果
plt.figure(figsize=(10, 5))

# 绘制原始数据点
plt.scatter(x.numpy(), y.numpy(), label='Data', color='blue', alpha=0.5)

# 绘制模型预测的拟合直线
with torch.no_grad():
    y_pred = model(x)
plt.plot(x.numpy(), y_pred.numpy(), label='MLP Fit', color='red', linewidth=2)

plt.xlabel('x')
plt.ylabel('y')
plt.title('MLP Fitting y = 2x + 1')
plt.legend()
plt.grid(True)
plt.show()

# 5. 绘制损失曲线
plt.figure(figsize=(10, 5))
plt.plot(range(num_epochs), losses, label='Training Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.title('Training Loss Curve')
plt.legend()
plt.grid(True)
plt.show()

代码说明

  1. 数据集生成: 使用 torch.linspace 生成 x,计算 y = 2x + 1 并添加高斯噪声模拟真实数据。 数据形状为 (100, 1),适合单输入单输出的回归任务。
  2. MLP 模型: 定义一个简单的 MLP,包含一个输入层(1 个神经元)、一个隐藏层(16 个神经元,ReLU 激活)、一个输出层(1 个神经元)。 使用 nn.Sequential 简化模型定义。
  3. 训练过程: 使用 MSE 损失函数(nn.MSELoss)和 Adam 优化器(optim.Adam)。 每次迭代清空梯度、计算损失、反向传播、更新参数。
  4. 可视化: 使用 Matplotlib 绘制原始数据点和拟合直线。 绘制训练过程中的损失曲线,观察模型收敛情况。

资源建议

  1. Google Colab: 直接将上述代码复制到 Colab 笔记本运行,无需本地配置 PyTorch。 Colab 提供免费 GPU 加速,适合快速实验。 链接:Google Colab
  2. PyTorch 官方文档: 张量操作:torch.Tensor 神经网络模块:torch.nn 优化器:torch.optim
  3. 推荐教程: PyTorch 官方入门教程:PyTorch Tutorials DeepLearning.AI 的 PyTorch 课程(免费):DeepLearning.AI PyTorch
  4. 补充练习: 修改隐藏层神经元数量(如 32 或 64),观察对拟合效果的影响。 尝试不同的激活函数(如 Sigmoid 或 Tanh),比较训练结果。 增加噪声幅度,测试模型的鲁棒性。

学习提示

  • 调试技巧:检查张量形状是否匹配(如 x 和 y 的维度),确保 requires_grad=True 用于需要梯度的张量。
  • 理解损失:如果损失不下降,尝试调整学习率(如 0.001 或 0.1)或增加 epoch 数量。
  • 实践建议:手动推导一次前向传播和反向传播的计算过程,加深对神经网络的理解。

相关推荐

Optional是个好东西,如果用错了就太可惜了

原文出处:https://xie.infoq.cn/article/e3d1f0f4f095397c44812a5be我们都知道,在Java8新增了一个类-Optional,主要是用来解决程...

IDEA建议:不要在字段上使用@Autowire了!

在使用IDEA写Spring相关的项目的时候,在字段上使用@Autowired注解时,总是会有一个波浪线提示:Fieldinjectionisnotrecommended.纳尼?我天天用,咋...

Spring源码|Spring实例Bean的方法

Spring实例Bean的方法,在AbstractAutowireCapableBeanFactory中的protectedBeanWrappercreateBeanInstance(String...

Spring技巧:深入研究Java 14和SpringBoot

在本期文章中,我们将介绍Java14中的新特性及其在构建基于SpringBoot的应用程序中的应用。开始,我们需要使用Java的最新版本,也是最棒的版本,Java14,它现在还没有发布。预计将于2...

Java开发200+个学习知识路线-史上最全(框架篇)

1.Spring框架深入SpringIOC容器:BeanFactory与ApplicationContextBean生命周期:实例化、属性填充、初始化、销毁依赖注入方式:构造器注入、Setter注...

年末将至,Java 开发者必须了解的 15 个Java 顶级开源项目

专注于Java领域优质技术,欢迎关注作者:SnailClimbStar的数量统计于2019-12-29。1.JavaGuideGuide哥大三开始维护的,目前算是纯Java类型项目中Sta...

字节跨平台框架 Lynx 开源:一个 Web 开发者的原生体验

最近各大厂都在开源自己的跨平台框架,前脚腾讯刚宣布计划四月开源基于Kotlin的跨平台框架「Kuikly」,后脚字节跳动旧开源了他们的跨平台框架「Lynx」,如果说Kuikly是一个面向...

我要狠狠的反驳“公司禁止使用Lombok”的观点

经常在其它各个地方在说公司禁止使用Lombok,我一直不明白为什么不让用,今天看到一篇文章列举了一下“缺点”,这里我只想狠狠地反驳,看到列举的理由我竟无言以对。原文如下:下面,结合我自己使用Lomb...

SpringBoot Lombok使用详解:从入门到精通(注解最全)

一、Lombok概述与基础使用1.1Lombok是什么Lombok是一个Java库,它通过注解的方式自动生成Java代码(如getter、setter、toString等),从而减少样板代码的编写,...

Java 8之后的那些新特性(六):记录类 Record Class

Java是一门面向对象的语言,而对于面向对象的语言中,一个众所周知的概念就是,对象是包含属性与行为的。比如HR系统中都会有雇员的概念,那雇员会有姓名,ID身份,性别等,这些我们称之为属性;而雇员同时肯...

为什么大厂要求安卓开发者掌握Kotlin和Jetpack?优雅草卓伊凡

为什么大厂要求安卓开发者掌握Kotlin和Jetpack?深度解析现代Android开发生态优雅草卓伊凡一、Kotlin:Android开发的现代语言选择1.1Kotlin是什么?Kotlin是由...

Kotlin这5招太绝了!码农秒变优雅艺术家!

Kotlin因其简洁性、空安全性和与Java的无缝互操作性而备受喜爱。虽然许多开发者熟悉协程、扩展函数和数据类等特性,但还有一些鲜为人知的特性可以让你的代码从仅仅能用变得真正优雅且异常简洁。让我们来看...

自行部署一款免费高颜值的IT资产管理系统-咖啡壶chemex

在运维时,ICT资产太多怎么办,还是用excel表格来管理?效率太低,也不好多人使用。在几个IT资产管理系统中选择比较中,最终在Snipe-IT和chemex间选择了chemex咖啡壶。Snip...

PHP对接百度语音识别技术(php对接百度语音识别技术实验报告)

引言在目前的各种应用场景中,语音识别技术已经越来越常用,并且其应用场景正在不断扩大。百度提供的语音识别服务允许用户通过简单的接口调用,将语音内容转换为文本。本文将通过PHP语言集成百度的语音识别服务,...

知识付费系统功能全解析(知识付费项目怎么样)

开发知识付费系统需包含核心功能模块,确保内容变现、用户体验及运营管理需求。以下是完整功能架构:一、用户端功能注册登录:手机号/邮箱注册,第三方登录(微信、QQ)内容浏览:分类展示课程、文章、音频等付费...