WebGPU:现代浏览器正式解锁GPU访问
liuian 2025-05-08 02:45 21 浏览
大家好,我是Echa。
好消息,WebGPU 组织正式宣布:现代浏览器正式解锁GPU访问。
前段时间小编整理的关于《重磅!谷歌正式发布 WebGPU》这篇文章,一经发布短短一个小时阅读量就高达1w阅读量,持续8个小时累计阅读量5.5w,非常受广大好友欢迎,在科技领域也算是爆款了。有兴趣的小伙伴们可以回头看看。
现在新的 WebGPU API 在图形和机器学习工作负载方面实现了巨大的性能提升。本文将探讨 WebGPU 如何改进当前 WebGL 解决方案,并展望未来的发展方向。
全文大纲
- WebGL 的起源
- WebGPU 背景
- 什么是 WebGPU?
- 解锁用于渲染的新 GPU 工作负载
- 更快的 ML 推理
- 首先为 Web JavaScript 设计
- WebGPU总结
WebGL 的起源
官网:
https://www.khronos.org/webgl/
说起起源,就不得不说OpenGL。
在个人计算机的早期,使用最广泛的 3D 图形渲染技术是 Direct3D 和 OpenGL。Direct3D 是微软 DirectX 技术的一部分,主要用于 Windows 平台。OpenGL作为一种开源的跨平台技术,赢得了众多开发者的青睐。
然后是一个特殊的版本——OpenGL ES。它专为嵌入式计算机、智能手机、家用游戏机和其他设备而设计。它从 OpenGL 中删除了许多旧的和无用的特性,同时添加了新特性。比如去掉矩形等多余的多边形,只保留点、线、三角形等基本图形。这使它能够保持轻量级,同时仍然足够强大以渲染漂亮的 3D 图形。
而 WebGL 是从 OpenGL ES 衍生而来的。它专注于 Web 的 3D 图形渲染。
下图显示了它们之间的关系:
WebGPU 背景
官网:http://webgpu.io/
WebGL 于 2011 年登陆 Chrome。通过允许 Web 应用利用 GPU,WebGL 可以在 Web 上实现惊人的体验——从 Google 地球到交互式音乐视频,再到 3D 房地产等等。WebGL是基于OpenGL系列API开发的,该API最初开发于1992年,自那时以来 GPU 硬件已经发生了极大的变化。
为跟上这一进步,一种新型的API被开发出来,以更高效地与现代GPU硬件交互。这些API包括Direct3D 12、Metal和Vulkan。这些新的 API 支持GPU编程的新的和苛刻的用例,例如机器学习的爆炸式增长和渲染算法的进步。WebGPU 是 WebGL 的继承者,将这种新型现代 API 的进步带到了 Web。
WebGPU 在浏览器中解锁了许多新的 GPU 编程可能性。它更好地反映了现代 GPU 硬件的工作方式,并为未来更高级的GPU功能奠定了基础。自2017年以来,这个API已经在W3C的“Web GPU”小组中不断完善,并得到了包括苹果、谷歌、Mozilla、微软和英特尔在内的众多公司的合作。经过 6 年的努力,很高兴地宣布,这项对 Web 平台最大的增强功能终于可用了!
WebGPU 现在可以在 Chrome OS、macOS和Windows上的Chrome 113中使用,其他平台也将会很快推出。
什么是 WebGPU
WebGPU 的目的是提供现代 3D 图形和计算能力。它是前端的老朋友W3C组织制定的标准。与 WebGL 不同,WebGPU 不是 OpenGL 的包装器。相反,它指的是当前的图形渲染技术,一种新的跨平台高性能图形界面。
它的设计更容易被三大图形框架实现,减轻了浏览器开发者的负担。它是一个精确的图形API,完全开放了整个显卡的能力。不再是像 WebGL 这样的上层 API。
更具体的优点如下:
- 减少 CPU 开销
- 对多线程的良好支持
- 使用计算着色器将通用计算 (GPGPU) 的强大功能引入 Web
- 全新的着色器语言——WebGPU Shading Language (WGSL)
- 未来将支持“实时光线追踪”的技术
这里我挑出多线程支持来详细说一下:
在 WebGL 中,你可以使用 OffscreenCanvas 进行多线程处理,但 Safari 尚不支持此功能。而且它的操作也很有限,你必须将整个 Canvas 的所有操作都转移到单个 Worker 上。
webGPU 上下文可以由多个工作人员共享。这些worker只要在时间线上没有互斥操作,都可以正常运行。这无疑带来了良好的开发体验。
这是因为 WebGL 全局状态的设置。它在设置状态后立即执行,这使得 WebGL 无法支持多线程。
而WebGPU用来Pipeline Object设置渲染管线中的相关信息。它分为两个阶段:“记录命令”和“提交命令”。
“记录命令”是一个纯 CPU 进程。可以分别记录在多个worker(多线程)中,然后提交到同一个队列中。
“提交命令”就是让GPU根据队列中的命令顺序执行。
下面来看一些令人兴奋的 WebGPU 使用案例。
解锁用于渲染的新 GPU 工作负载
诸如计算着色器之类的 WebGPU 功能使新类别的算法能够移植到 GPU 上。例如,可以为场景添加更多动态细节、模拟物理现象等算法!甚至以前只能用 JavaScript 完成的工作负载现在可以转移到 GPU 上。
以下视频显示了用于对这些圆球表面进行三角测量的行进立方体算法。在视频的前 20 秒内,当该算法在 JavaScript 中运行时,它很难跟上仅以 8 FPS 运行的页面,从而导致动画卡顿。为了在 JavaScript 中保持高性能,需要大量降低细节级别。
当我们将相同的算法移动到计算着色器时,这是一个白天和黑夜的区别,这在 20 秒后的视频中可以看到。性能显著提高,页面现在以 60 FPS 的流畅速度运行,并且对于其他效果仍有很大的性能提升空间。此外,页面的主要 JavaScript 循环完全释放出来用于其他任务,确保与页面的交互保持响应。
WebGPU 还可以实现以前不实用的复杂视觉效果。在以下示例中,在流行的 Babylon.js 库中创建,海洋表面完全在 GPU 上模拟。逼真的动态是由许多相互添加的独立波创建的。但是直接模拟每个波浪太昂贵了。
这就是演示使用称为快速傅立叶变换的高级算法的原因。这不是将所有波表示为复杂的位置数据,而是使用更有效地执行计算的光谱数据。然后每一帧使用傅立叶变换将光谱数据转换为代表波浪高度的位置数据。
更快的 ML 推理
WebGPU 还可用于加速机器学习,这已成为近年来 GPU 的主要用途。
长期以来,创发人员一直在重新利用 WebGL 的渲染 API 来执行非渲染操作,例如机器学习计算。然而,这需要绘制三角形的像素作为启动计算的一种方式,并仔细打包和解包纹理中的张量数据,而不是更通用的内存访问。
以这种方式使用 WebGL 需要开发人员笨拙地使他们的代码符合专为绘图而设计的 API 的期望。再加上缺乏计算之间的共享内存访问等基本功能,这会导致重复工作和次优性能。
计算着色器时 WebGPU 的主要新功能,可以消除这些痛点。计算着色器提供更灵活的编程模型,利用 GPU 的大规模并行特性,同时不受严格的渲染操作结构的限制。
计算着色器为在着色器工作组内共享数据和计算结果提供了更多机会,以提高效率。与之前出于相同目的使用 WebGL 的尝试相比,这可能会带来显著的收益。
作为这可以带来的效率提升的一个例子,TensorFlow.js 中图像扩散模型的初始端口显示,当从 WebGL 移动到 WebGPU 时,各种硬件的性能提升了 3 倍。在一些测试过的硬件上,图像渲染时间不到 10 秒。因为这是一个早期的端口,相信 WebGPU 和 TensorFlow.js 都有更多改进的可能!
但 WebGPU 不仅仅是将 GPU 功能带到 Web 上。
首先为 Web JavaScript 设计
WebGPU是在对WebGL开发人员十年的工作经验进行反思的基础上开发的。将他们遇到的问题、遇到的瓶颈和提出的问题整理出来,并将所有反馈汇总到这个新的API中。
WebGL 的全局状态模型使得创建强大、可组合的库和应用变得困难和脆弱。因此,WebGPU大大减少了开发人员需要跟踪GPU命令时需要跟踪的状态数量。
调试 WebGL 应用是很痛苦的,因此WebGPU包括了更灵活的错误处理机制,不会降低性能。而且确保从API中获得的每条消息都易于理解和可操作。
频繁调用过多的 JavaScript 函数会成为复杂 WebGL 应用的瓶颈。因此,WebGPU API 的通信量较少,因此可以用更少的函数调用完成更多的任务。专注于在前期执行重量级验证,尽可能使关键的绘制循环精简。提供了像渲染捆绑一类的新 API,它允许预先记录大量的绘图命令,并以单个调用重播它们。
为了展示像渲染捆绑这样一个功能会带来多么大的变化,下面是Babylon.js的另一个演示。他们的 WebGL 2 渲染器可以每秒执行约 500次 JavaScript 调用以呈现这个美术馆场景。
然而,他们的 WebGPU 渲染器启用了一项称为快照渲染的功能。此功能构建在 WebGPU 渲染包之上,可使提交相同场景的速度提高 10 倍以上。这种显著减少的开销使 WebGPU 能够呈现更复杂的场景,同时还允许应用使用 JavaScript 并行执行更多操作。
现代图形 API 以复杂性、以简单性换取极端优化机会而著称。另一方面,WebGPU 专注于跨平台兼容性,在大多数情况下自动处理资源同步等传统难题。
WebGPU 易于学习和使用。它依赖于网络平台的现有功能来进行图像和视频加载等操作,并依赖于众所周知的 JavaScript 模式,例如用于异步操作的 Promises。这有助于将所需的样板代码数量保持在最低限度。可以用不到 50 行代码在屏幕上显示第一个三角形。
<canvas id="canvas" width="512" height="512"></canvas>
<script type="module">
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const context = canvas.getContext("webgpu");
const format = navigator.gpu.getPreferredCanvasFormat();
context.configure({ device, format });
const code = `
@vertex fn vertexMain(@builtin(vertex_index) i : u32) ->
@builtin(position) vec4f {
const pos = array(vec2f(0, 1), vec2f(-1, -1), vec2f(1, -1));
return vec4f(pos[i], 0, 1);
}
@fragment fn fragmentMain() -> @location(0) vec4f {
return vec4f(1, 0, 0, 1);
}`;
const shaderModule = device.createShaderModule({ code });
const pipeline = device.createRenderPipeline({
layout: "auto",
vertex: {
module: shaderModule,
entryPoint: "vertexMain",
},
fragment: {
module: shaderModule,
entryPoint: "fragmentMain",
targets: [{ format }],
},
});
const commandEncoder = device.createCommandEncoder();
const colorAttachments = [
{
view: context.getCurrentTexture().createView(),
loadOp: "clear",
storeOp: "store",
},
];
const passEncoder = commandEncoder.beginRenderPass({ colorAttachments });
passEncoder.setPipeline(pipeline);
passEncoder.draw(3);
passEncoder.end();
device.queue.submit([commandEncoder.finish()]);
</script>
WebGPU总结
很高兴看到 WebGPU 为 Web 平台带来的所有新可能性,围绕 WebGL 构建了一个充满活力的库和框架生态系统,并且同样的生态系统渴望拥抱 WebGPU。在许多流行的 Javascript WebGL 库中,对 WebGPU 的支持正在进行中或已经完成,在某些情况下,利用 WebGPU 的优势可能就像更改单个标志一样简单!
Chrome 113 中的第一个版本只是一个开始。虽然初始版本适用于 Windows、ChromeOS 和 MacOS,但计划在不久的将来将 WebGPU 引入其余平台,如 Android 和 Linux。
致力于推出 WebGPU 的不仅仅是 Chrome 团队。Firefox 和 WebKit 的实现也在进行中。
此外,W3C 已经在设计新功能,这些功能在硬件可用时可以公开。例如:在 Chrome 中,计划很快在着色器和 DP4 类指令中启用对 16 位浮点数的支持,以进一步提高机器学习性能。
WebGPU是一个广泛的API,可以释放惊人的性能。本文只能对其优点进行概述,但如果想亲身体验WebGPU,可以查看入门 Codelab《Your first WebGPU app》,将构建经典康威生命游戏的GPU版本。这个 Codelab 会逐步引导完成整个过程,因此即使第一次进行GPU开发,也可以轻松尝试。
WebGPU app:https://codelabs.developers.google.com/your-first-webgpu-app
最后
一台电脑,一个键盘,尽情挥洒智慧的人生;几行数字,几个字母,认真编写生活的美好;
一 个灵感,一段程序,推动科技进步,促进社会发展。
创作不易,喜欢的老铁们加个关注,点个赞,打个赏,后面会不定期更新干货和技术相关的资讯,速速收藏,谢谢!你们的一个小小举动就是对小编的认可,更是创作的动力。
相关推荐
- Python 中 必须掌握的 20 个核心函数——items()函数
-
items()是Python字典对象的方法,用于返回字典中所有键值对的视图对象。它提供了对字典完整内容的高效访问和操作。一、items()的基本用法1.1方法签名dict.items()返回:字典键...
- Python字典:键值对的艺术_python字典的用法
-
字典(dict)是Python的核心数据结构之一,与列表同属可变序列,但采用完全不同的存储方式:定义方式:使用花括号{}(列表使用方括号[])存储结构:以键值对(key-valuepair)...
- python字典中如何添加键值对_python怎么往字典里添加键
-
添加键值对首先定义一个空字典1>>>dic={}直接对字典中不存在的key进行赋值来添加123>>>dic['name']='zhangsan'>>...
- Spring Boot @ConfigurationProperties 详解与 Nacos 配置中心集成
-
本文将深入探讨SpringBoot中@ConfigurationProperties的详细用法,包括其语法细节、类型转换、复合类型处理、数据校验,以及与Nacos配置中心的集成方式。通过...
- Dubbo概述_dubbo工作原理和机制
-
什么是RPCRPC是RemoteProcedureCall的缩写翻译为:远程过程调用目标是为了实现两台(多台)计算机\服务器,互相调用方法\通信的解决方案RPC的概念主要定义了两部分内容序列化协...
- 再见 Feign!推荐一款微服务间调用神器,跟 SpringCloud 绝配
-
在微服务项目中,如果我们想实现服务间调用,一般会选择Feign。之前介绍过一款HTTP客户端工具Retrofit,配合SpringBoot非常好用!其实Retrofit不仅支持普通的HTTP调用,还能...
- SpringGateway 网关_spring 网关的作用
-
奈非框架简介早期(2020年前)奈非提供的微服务组件和框架受到了很多开发者的欢迎这些框架和SpringCloudAlibaba的对应关系我们要知道Nacos对应Eureka都是注册中心Dubbo...
- Sentinel 限流详解-Sentinel与OpenFeign服务熔断那些事
-
SentinelResource我们使用到过这个注解,我们需要了解的是其中两个属性:value:资源名称,必填且唯一。@SentinelResource(value="test/get...
- 超详细MPLS学习指南 手把手带你实现IP与二层网络的无缝融合
-
大家晚上好,我是小老虎,今天的文章有点长,但是都是干货,耐心看下去,不会让你失望的哦!随着ASIC技术的发展,路由查找速度已经不是阻碍网络发展的瓶颈。这使得MPLS在提高转发速度方面不再具备明显的优势...
- Cisco 尝试配置MPLS-V.P.N从开始到放弃
-
本人第一次接触这个协议,所以打算分两篇进行学习和记录,本文枯燥预警,配置命令在下一篇全为定义,其也是算我毕业设计的一个小挑战。新概念重点备注为什么选择该协议IPSecVPN都属于传统VPN传统VP...
- MFC -- 网络通信编程_mfc编程教程
-
要买东西的时候,店家常常说,你要是真心买的,还能给你便宜,你看真心就是不怎么值钱。。。----网易云热评一、创建服务端1、新建一个控制台应用程序,添加源文件server2、添加代码框架#includ...
- 35W快充?2TB存储?iPhone14爆料汇总,不要再漫天吹15了
-
iPhone14都还没发布,关于iPhone15的消息却已经漫天飞,故加紧整理了关于iPhone14目前已爆出的消息。本文将从机型、刘海、屏幕、存储、芯片、拍照、信号、机身材质、充电口、快充、配色、价...
- SpringCloud Alibaba(四) - Nacos 配置中心
-
1、环境搭建1.1依赖<!--nacos注册中心注解@EnableDiscoveryClient--><dependency><groupI...
- Nacos注册中心最全详解(图文全面总结)
-
Nacos注册中心是微服务的核心组件,也是大厂经常考察的内容,下面我就重点来详解Nacos注册中心@mikechen本篇已收于mikechen原创超30万字《阿里架构师进阶专题合集》里面。微服务注册中...
- 网络技术领域端口号备忘录,受益匪浅 !
-
你好,这里是网络技术联盟站,我是瑞哥。网络端口是计算机网络中用于区分不同应用程序和服务的标识符。每个端口号都是一个16位的数字,范围从0到65535。网络端口的主要功能是帮助网络设备(如计算机和服务器...
- 一周热门
-
-
【验证码逆向专栏】vaptcha 手势验证码逆向分析
-
Python实现人事自动打卡,再也不会被批评
-
Psutil + Flask + Pyecharts + Bootstrap 开发动态可视化系统监控
-
一个解决支持HTML/CSS/JS网页转PDF(高质量)的终极解决方案
-
再见Swagger UI 国人开源了一款超好用的 API 文档生成框架,真香
-
网页转成pdf文件的经验分享 网页转成pdf文件的经验分享怎么弄
-
C++ std::vector 简介
-
飞牛OS入门安装遇到问题,如何解决?
-
系统C盘清理:微信PC端文件清理,扩大C盘可用空间步骤
-
10款高性能NAS丨双十一必看,轻松搞定虚拟机、Docker、软路由
-
- 最近发表
-
- Python 中 必须掌握的 20 个核心函数——items()函数
- Python字典:键值对的艺术_python字典的用法
- python字典中如何添加键值对_python怎么往字典里添加键
- Spring Boot @ConfigurationProperties 详解与 Nacos 配置中心集成
- Dubbo概述_dubbo工作原理和机制
- 再见 Feign!推荐一款微服务间调用神器,跟 SpringCloud 绝配
- SpringGateway 网关_spring 网关的作用
- Sentinel 限流详解-Sentinel与OpenFeign服务熔断那些事
- 超详细MPLS学习指南 手把手带你实现IP与二层网络的无缝融合
- Cisco 尝试配置MPLS-V.P.N从开始到放弃
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)