百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

CPU眼里的:汇编语言

liuian 2025-03-12 16:47 11 浏览

我们需要学习汇编语言吗?学多少合适?怎么学习会比较有效?


01

提出问题

如何有效的学习汇编语言?答案往往取决于你的使用场景。今天汇编语言几乎退出了常规编程语言的行列。除非你是专门的CPU或芯片开发工程师,一般来说你的日常工作都不会接触汇编语言。

但如果作C/C++语言编程的话,一点点的汇编语言,却可能帮你打开一个新世界。


02

代码分析

打开 Compiler Explorer,写一个简单的自加函数,如图所示:

其中,左下角是CPU的初始状态,所有的寄存器初始值都是:0x100。

其中寄存器 rax,一般用来存放数值,有点类似 C 语言的普通变量;而寄存器 rbp,rsp,一般用来存放内存地址,有点类似 C 语言的指针变量。

线程往往通过调用函数来运行,因此,必须要有一个“堆栈”,用来存储:临时变量和函数返回地址,所以“堆栈”内存是必不可少的。而rbp,rsp寄存器,就是用来管理、读写“堆栈”内存的。具体的分析,可以参看“CPU眼里的{函数括号}”

首先看:函数 { 对应的汇编指令:push,千万不要被这个熟悉、亲切的名字迷惑。这是典型的复杂指令,无数同学被它直接劝退,如图所示。

push 对应了 2 个微操作:

第一步:先让“栈顶”向低生长,也就是让rsp 寄存器的值,减:8,此时寄存器rsp保存的值就是:0xF8;

第二步:随后把将寄存器 rbp 的值(0x100),存放在“栈顶”寄存器 rsp 指向的内存地址:0xF8处。

随后是一个简单的 mov 指令,把寄存器 rsp 的值,赋给寄存器 rbp,如图所示:

至此,函数的栈帧保护工作完成,更详细的栈帧工作原理;可以参看“CPU眼里的{函数括号}”

接着,是一个比较复杂的 mov 指令,如图所示:

但通过参考源代码,我们很容易猜出它是要把数值 1,写入到变量 a 所在的内存。

用于写入的 mov 指令和数值 1 都很容易找到,但变量 a 的内存地址,就显得颇为复杂。不过 PTR 关键字显然在提示我们:这是一个指针操作,再加上 rbp 本身就是类似指针变量的寄存器。

所以,它对应的 C 语言,是这样的:*(rbp - 8) = 1

变量 a 的内存地址,等于:寄存器 rbp 的值减 8;而中括号,就是相当于指针变量的 * 操作;QWORD 是指针类型,表明数值 1 将占用:8 个字节长度。

你是不是也从中看到了:C 语言的影子?所以说:C 语言是最接近底层的高级语言,真的一点都不过分。同样,相比于精简指令集,复杂指令集对程序员而言,也更加接近 C 语言。

好了,如果此时,你还能跟上阿布的节奏,那么恭喜你!因为,这就是本文中,最难的汇编语言了。后面的学习,将轻松不少。

让我们接着进行自加运算,如图所示:

这种带 PTR 和 [] 的 add 指令,也有 2 个微操作,它们对应的 C 语言是这样的:*(rbp – 8) = *(rbp – 8) + 2

o 首先,用指针的 * 读操作,获得变量 a 的值,并与 2 作加法运算;

o 最后,把加法运算的结果,通过指针的 * 写操作,写入变量 a 所在的内存。

随后的 mov 指令,同样是一个带 PTR 和 [] 的指令,分析的方法,跟上面的 mov 指令一致,如图所示:

它对应的 C 语言是这样的:rax = *(rbp – 8)

只是不同于上面的 mov 指令,是一个写内存的操作;这次则是把 a 的值从内存中读出来,并写入到寄存器 rax 里面。

或许,你会纳闷:为什么普通变量操作,背后也弄的跟“指针”一样?在 CPU 眼里的,万物皆有地址,万物皆可指针。指针变量,跟普通变量并无本质区别,具体可以参看“CPU眼里的:指针本质和风险”

最后,就是 push 的反向操作:pop,如图所示:

它也对应了 2 个微操作:

第一步:把寄存器 rsp 指向的“栈顶”值(0x100),写入到寄存器:rbp;

第二步:随着“栈顶”的升高,rsp 寄存器的值,也随之加:8。

至此,整个代码基本走完,除了用于作返回值的寄存器 rax;所有寄存器,都恢复到了刚开始的状况,就像 test 函数从未被调用一样。


03

思考

或许,本章节是本书中,最乏味的一个。因为,在没有结合编译器意图的情况下,单独讨论每条汇编指令,是非常乏味的!

不知道:读者里面,有没有干过工地的工友?很多精神、漂亮的房子,在真正施工的时候,不过是在重复:搭钢筋,倒水泥;再搭钢筋,再倒水泥的重复工作。而 CPU 也是如此,我们不过是把数据,在寄存器和内存之间,搬来搬去。

或许,本章节也是全书中,最具洞察力的一节。经过粗略的统计,我们发现:为了作 1 次简单的 +2 运算,居然产生了(至少) 5 次的内存读写,内存读写的占比高达:83%!

虽然,经过编译器优化后,一些没有必要的内存读写指令,会被优化掉。但对于复杂程序,其内存的读写总量,仍然不容小觑!有些机构给出的结论显示:CPU 的内存读写,占据了 CPU 90%的工作负荷。

这也是为什么苹果的 M 系列 CPU,在没有显著提高:CPU 核心频率的情况下,也能产生:秒杀同行的炸裂性能,因为它着重优化了:CPU 读、写内存的效率。


04

总结

1. 虽然完整的 CPU 寄存器和指令集,比较庞大。但编译器,只会用到很小的一部分,而且使用的套路也很单一。一旦克服恐惧心理,就很容易掌握。

2. C/C++语言,对应的汇编指令,存在大量的类似 “指针” 的操作,我们也叫它:寄存器间接寻址。夸张的说 “指针” 不仅是 C 语言的灵魂,也是汇编语言的灵魂。

3. 相比于精简指令集,复杂指令集对程序员而言,更加接近 C 语言。在那个只有汇编语言的年代,复杂指令集,十分有助于提高编程效率。

最后,作为普通程序员,我们直接使用汇编语言编程的可能性几乎为 0。在今天,汇编语言,也不是大规模软件开发的首选。所以,很多时候,我们并不需要成为汇编语言的专家。

阿布认为,普通开发者学习汇编语言,最好要结合特定、必要的场景。例如:我们可以用 CPU 视角,解读出一个真实的程序运行过程;或帮助我们调试、解决一些无法在语言层面表现出来的 bug。


05

热点问题

Q1:寄存器eax和寄存器rax有什么区别?

A1:寄存器eax是32位的x86 CPU的寄存器,如今的x86 CPU多是64位的,其对应的寄存器是rax,eax只是rax的低32位而已。


Q2:不精通汇编语言,等于白学编程语言了?

A2:当然不是。对于学习C/C++这种相对接近底层的语言,它对应的汇编语言还是比较简单、易懂的,完全不需要你精通汇编。同时,一些新的编程语言,例如:RUST,SWIFT,编译器对代码封装得比较厉害,就不容易通过对应的汇编指令,了解语言的实现细节了。

而且有些语言,例如:Java,JavaScript对应的是字节码,并没有汇编指令可以参考,但这并不妨碍大家掌握它们。


Q3:现在学习8086汇编语言,会不会有点老?

A3:这取决于我们的学习目的,如果是为了学习一门编程语言的话,8086是够用的。不过阿布更愿意结合目前最新、最主流的CPU来学习汇编语言,这不仅仅是因为更接近目前真实的计算场景,更重要的是,C/C++等主流编程语言,也往往是基于32/64位CPU设计的,我们能够在学习汇编语言的过程中,顺便解读C/C++语言的设计原理和工作细节,岂不是一举多得?


06

更多知识

如果喜欢阿布这种解读方式,希望更加系统学习这些编程知识的话,也可以考虑看看由阿布亲自编写,并由多位微软大佬联袂推荐的新书《CPU眼里的C/C++》

<script type="text/javascript" src="//mp.toutiao.com/mp/agw/mass_profit/pc_product_promotions_js?item_id=7328309651353797155"></script>

相关推荐

2023年最新微信小程序抓包教程(微信小程序 抓包)

声明:本公众号大部分文章来自作者日常学习笔记,部分文章经作者授权及其他公众号白名单转载。未经授权严禁转载。如需转载,请联系开百。请不要利用文章中的相关技术从事非法测试。由此产生的任何不良后果与文...

测试人员必看的软件测试面试文档(软件测试面试怎么说)

前言又到了毕业季,我们将会迎来许多需要面试的小伙伴,在这里呢笔者给从事软件测试的小伙伴准备了一份顶级的面试文档。1、什么是bug?bug由哪些字段(要素)组成?1)将在电脑系统或程序中,隐藏着的...

复活,视频号一键下载,有手就会,长期更新(2023-12-21)

视频号下载的话题,也算是流量密码了。但也是比较麻烦的问题,频频失效不说,使用方法也难以入手。今天,奶酪就来讲讲视频号下载的新方案,更关键的是,它们有手就会有用,最后一个方法万能。实测2023-12-...

新款HTTP代理抓包工具Proxyman(界面美观、功能强大)

不论是普通的前后端开发人员,还是做爬虫、逆向的爬虫工程师和安全逆向工程,必不可少会使用的一种工具就是HTTP抓包工具。说到抓包工具,脱口而出的肯定是浏览器F12开发者调试界面、Charles(青花瓷)...

使用Charles工具对手机进行HTTPS抓包

本次用到的工具:Charles、雷电模拟器。比较常用的抓包工具有fiddler和Charles,今天讲Charles如何对手机端的HTTS包进行抓包。fiddler抓包工具不做讲解,网上有很多fidd...

苹果手机下载 TikTok 旧版本安装包教程

目前苹果手机能在国内免拔卡使用的TikTok版本只有21.1.0版本,而AppStore是高于21.1.0版本,本次教程就是解决如何下载TikTok旧版本安装包。前期准备准备美区...

【0基础学爬虫】爬虫基础之抓包工具的使用

大数据时代,各行各业对数据采集的需求日益增多,网络爬虫的运用也更为广泛,越来越多的人开始学习网络爬虫这项技术,K哥爬虫此前已经推出不少爬虫进阶、逆向相关文章,为实现从易到难全方位覆盖,特设【0基础学爬...

防止应用调试分析IP被扫描加固实战教程

防止应用调试分析IP被扫描加固实战教程一、概述在当今数字化时代,应用程序的安全性已成为开发者关注的焦点。特别是在应用调试过程中,保护应用的网络安全显得尤为重要。为了防止应用调试过程中IP被扫描和潜在的...

一文了解 Telerik Test Studio 测试神器

1.简介TelerikTestStudio(以下称TestStudio)是一个易于使用的自动化测试工具,可用于Web、WPF应用的界面功能测试,也可以用于API测试,以及负载和性能测试。Te...

HLS实战之Wireshark抓包分析(wireshark抓包总结)

0.引言Wireshark(前称Ethereal)是一个网络封包分析软件。网络封包分析软件的功能是撷取网络封包,并尽可能显示出最为详细的网络封包资料。Wireshark使用WinPCAP作为接口,直接...

信息安全之HTTPS协议详解(加密方式、证书原理、中间人攻击 )

HTTPS协议详解(加密方式、证书原理、中间人攻击)HTTPS协议的加密方式有哪些?HTTPS证书的原理是什么?如何防止中间人攻击?一:HTTPS基本介绍:1.HTTPS是什么:HTTPS也是一个...

Fiddler 怎么抓取手机APP:抖音、小程序、小红书数据接口

使用Fiddler抓取移动应用程序(APP)的数据接口需要进行以下步骤:首先,确保手机与计算机连接在同一网络下。在计算机上安装Fiddler工具,并打开它。将手机的代理设置为Fiddler代理。具体方...

python爬虫教程:教你通过 Fiddler 进行手机抓包

今天要说说怎么在我们的手机抓包有时候我们想对请求的数据或者响应的数据进行篡改怎么做呢?我们经常在用的手机手机里面的数据怎么对它抓包呢?那么...接下来就是学习python的正确姿势我们要用到一款强...

Fiddler入门教程全家桶,建议收藏

学习Fiddler工具之前,我们先了解一下Fiddler工具的特点,Fiddler能做什么?如何使用Fidder捕获数据包、修改请求、模拟客户端向服务端发送请求、实施越权的安全性测试等相关知识。本章节...

fiddler如何抓取https请求实现手机抓包(100%成功解决)

一、HTTP协议和HTTPS协议。(1)HTTPS协议=HTTP协议+SSL协议,默认端口:443(2)HTTP协议(HyperTextTransferProtocol):超文本传输协议。默认...