百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

CPU眼里的:汇编语言

liuian 2025-03-12 16:47 24 浏览

我们需要学习汇编语言吗?学多少合适?怎么学习会比较有效?


01

提出问题

如何有效的学习汇编语言?答案往往取决于你的使用场景。今天汇编语言几乎退出了常规编程语言的行列。除非你是专门的CPU或芯片开发工程师,一般来说你的日常工作都不会接触汇编语言。

但如果作C/C++语言编程的话,一点点的汇编语言,却可能帮你打开一个新世界。


02

代码分析

打开 Compiler Explorer,写一个简单的自加函数,如图所示:

其中,左下角是CPU的初始状态,所有的寄存器初始值都是:0x100。

其中寄存器 rax,一般用来存放数值,有点类似 C 语言的普通变量;而寄存器 rbp,rsp,一般用来存放内存地址,有点类似 C 语言的指针变量。

线程往往通过调用函数来运行,因此,必须要有一个“堆栈”,用来存储:临时变量和函数返回地址,所以“堆栈”内存是必不可少的。而rbp,rsp寄存器,就是用来管理、读写“堆栈”内存的。具体的分析,可以参看“CPU眼里的{函数括号}”

首先看:函数 { 对应的汇编指令:push,千万不要被这个熟悉、亲切的名字迷惑。这是典型的复杂指令,无数同学被它直接劝退,如图所示。

push 对应了 2 个微操作:

第一步:先让“栈顶”向低生长,也就是让rsp 寄存器的值,减:8,此时寄存器rsp保存的值就是:0xF8;

第二步:随后把将寄存器 rbp 的值(0x100),存放在“栈顶”寄存器 rsp 指向的内存地址:0xF8处。

随后是一个简单的 mov 指令,把寄存器 rsp 的值,赋给寄存器 rbp,如图所示:

至此,函数的栈帧保护工作完成,更详细的栈帧工作原理;可以参看“CPU眼里的{函数括号}”

接着,是一个比较复杂的 mov 指令,如图所示:

但通过参考源代码,我们很容易猜出它是要把数值 1,写入到变量 a 所在的内存。

用于写入的 mov 指令和数值 1 都很容易找到,但变量 a 的内存地址,就显得颇为复杂。不过 PTR 关键字显然在提示我们:这是一个指针操作,再加上 rbp 本身就是类似指针变量的寄存器。

所以,它对应的 C 语言,是这样的:*(rbp - 8) = 1

变量 a 的内存地址,等于:寄存器 rbp 的值减 8;而中括号,就是相当于指针变量的 * 操作;QWORD 是指针类型,表明数值 1 将占用:8 个字节长度。

你是不是也从中看到了:C 语言的影子?所以说:C 语言是最接近底层的高级语言,真的一点都不过分。同样,相比于精简指令集,复杂指令集对程序员而言,也更加接近 C 语言。

好了,如果此时,你还能跟上阿布的节奏,那么恭喜你!因为,这就是本文中,最难的汇编语言了。后面的学习,将轻松不少。

让我们接着进行自加运算,如图所示:

这种带 PTR 和 [] 的 add 指令,也有 2 个微操作,它们对应的 C 语言是这样的:*(rbp – 8) = *(rbp – 8) + 2

o 首先,用指针的 * 读操作,获得变量 a 的值,并与 2 作加法运算;

o 最后,把加法运算的结果,通过指针的 * 写操作,写入变量 a 所在的内存。

随后的 mov 指令,同样是一个带 PTR 和 [] 的指令,分析的方法,跟上面的 mov 指令一致,如图所示:

它对应的 C 语言是这样的:rax = *(rbp – 8)

只是不同于上面的 mov 指令,是一个写内存的操作;这次则是把 a 的值从内存中读出来,并写入到寄存器 rax 里面。

或许,你会纳闷:为什么普通变量操作,背后也弄的跟“指针”一样?在 CPU 眼里的,万物皆有地址,万物皆可指针。指针变量,跟普通变量并无本质区别,具体可以参看“CPU眼里的:指针本质和风险”

最后,就是 push 的反向操作:pop,如图所示:

它也对应了 2 个微操作:

第一步:把寄存器 rsp 指向的“栈顶”值(0x100),写入到寄存器:rbp;

第二步:随着“栈顶”的升高,rsp 寄存器的值,也随之加:8。

至此,整个代码基本走完,除了用于作返回值的寄存器 rax;所有寄存器,都恢复到了刚开始的状况,就像 test 函数从未被调用一样。


03

思考

或许,本章节是本书中,最乏味的一个。因为,在没有结合编译器意图的情况下,单独讨论每条汇编指令,是非常乏味的!

不知道:读者里面,有没有干过工地的工友?很多精神、漂亮的房子,在真正施工的时候,不过是在重复:搭钢筋,倒水泥;再搭钢筋,再倒水泥的重复工作。而 CPU 也是如此,我们不过是把数据,在寄存器和内存之间,搬来搬去。

或许,本章节也是全书中,最具洞察力的一节。经过粗略的统计,我们发现:为了作 1 次简单的 +2 运算,居然产生了(至少) 5 次的内存读写,内存读写的占比高达:83%!

虽然,经过编译器优化后,一些没有必要的内存读写指令,会被优化掉。但对于复杂程序,其内存的读写总量,仍然不容小觑!有些机构给出的结论显示:CPU 的内存读写,占据了 CPU 90%的工作负荷。

这也是为什么苹果的 M 系列 CPU,在没有显著提高:CPU 核心频率的情况下,也能产生:秒杀同行的炸裂性能,因为它着重优化了:CPU 读、写内存的效率。


04

总结

1. 虽然完整的 CPU 寄存器和指令集,比较庞大。但编译器,只会用到很小的一部分,而且使用的套路也很单一。一旦克服恐惧心理,就很容易掌握。

2. C/C++语言,对应的汇编指令,存在大量的类似 “指针” 的操作,我们也叫它:寄存器间接寻址。夸张的说 “指针” 不仅是 C 语言的灵魂,也是汇编语言的灵魂。

3. 相比于精简指令集,复杂指令集对程序员而言,更加接近 C 语言。在那个只有汇编语言的年代,复杂指令集,十分有助于提高编程效率。

最后,作为普通程序员,我们直接使用汇编语言编程的可能性几乎为 0。在今天,汇编语言,也不是大规模软件开发的首选。所以,很多时候,我们并不需要成为汇编语言的专家。

阿布认为,普通开发者学习汇编语言,最好要结合特定、必要的场景。例如:我们可以用 CPU 视角,解读出一个真实的程序运行过程;或帮助我们调试、解决一些无法在语言层面表现出来的 bug。


05

热点问题

Q1:寄存器eax和寄存器rax有什么区别?

A1:寄存器eax是32位的x86 CPU的寄存器,如今的x86 CPU多是64位的,其对应的寄存器是rax,eax只是rax的低32位而已。


Q2:不精通汇编语言,等于白学编程语言了?

A2:当然不是。对于学习C/C++这种相对接近底层的语言,它对应的汇编语言还是比较简单、易懂的,完全不需要你精通汇编。同时,一些新的编程语言,例如:RUST,SWIFT,编译器对代码封装得比较厉害,就不容易通过对应的汇编指令,了解语言的实现细节了。

而且有些语言,例如:Java,JavaScript对应的是字节码,并没有汇编指令可以参考,但这并不妨碍大家掌握它们。


Q3:现在学习8086汇编语言,会不会有点老?

A3:这取决于我们的学习目的,如果是为了学习一门编程语言的话,8086是够用的。不过阿布更愿意结合目前最新、最主流的CPU来学习汇编语言,这不仅仅是因为更接近目前真实的计算场景,更重要的是,C/C++等主流编程语言,也往往是基于32/64位CPU设计的,我们能够在学习汇编语言的过程中,顺便解读C/C++语言的设计原理和工作细节,岂不是一举多得?


06

更多知识

如果喜欢阿布这种解读方式,希望更加系统学习这些编程知识的话,也可以考虑看看由阿布亲自编写,并由多位微软大佬联袂推荐的新书《CPU眼里的C/C++》

<script type="text/javascript" src="//mp.toutiao.com/mp/agw/mass_profit/pc_product_promotions_js?item_id=7328309651353797155"></script>

相关推荐

搭建一个20人的办公网络(适用于20多人的小型办公网络环境)

楼主有5台机上网,则需要一个8口路由器,组网方法如下:设备:1、8口路由器一台,其中8口为LAN(局域网)端口,一个WAN(广域网)端口,价格100--400元2、网线N米,这个你自己会看了:)...

笔记本电脑各种参数介绍(笔记本电脑各项参数新手普及知识)

1、CPU:这个主要取决于频率和二级缓存,频率越高、二级缓存越大,速度越快,现在的CPU有三级缓存、四级缓存等,都影响相应速度。2、内存:内存的存取速度取决于接口、颗粒数量多少与储存大小,一般来说,内...

汉字上面带拼音输入法下载(字上面带拼音的输入法是哪个)

使用手机上的拼音输入法打成汉字的方法如下:1.打开手机上的拼音输入法,在输入框中输入汉字的拼音,例如“nihao”。2.根据输入法提示的候选词,选择正确的汉字。例如,如果输入“nihao”,输...

xpsp3安装版系统下载(windowsxpsp3安装教程)

xpsp3纯净版在采用微软封装部署技术的基础上,结合作者的实际工作经验,融合了许多实用的功能。它通过一键分区、一键装系统、自动装驱动、一键设定分辨率,一键填IP,一键Ghost备份(恢复)等一系列...

没有备份的手机数据怎么恢复

手机没有备份恢复数据方法如下1、使用数据线将手机与电脑连接好,在“我的电脑”中可以看到手机的盘符。  2、将手机开启USB调试模式。在手机设置中找到开发者选项,然后点击“开启USB调试模式”。  3、...

电脑怎么激活windows11专业版

win11专业版激活方法有多种,以下提供两种常用的激活方式:方法一:使用激活密钥激活。在win11桌面上右键点击“此电脑”,选择“属性”选项。进入属性页面后,点击“更改产品密钥或升级windows”。...

华为手机助手下载官网(华为手机助手app下载专区)

华为手机助手策略调整,已不支持从应用市场下载手机助手,目前华为手机助手是需要在电脑上下载或更新手机助手到最新版本,https://consumer.huawei.com/cn/support/his...

光纤线断了怎么接(宽带光纤线断了怎么接)

宽带光纤线断了可以重接,具体操作方法如下:1、光纤连接的时候要根据束管内,同色相连,同芯相连,按顺序进行连接,由大到小。一般有三种连接方法,分别是熔接、活动连接和机械连接。2、连接的时候要开剥光缆,抛...

深度操作系统安装教程(深度操作系统安装教程图解)
  • 深度操作系统安装教程(深度操作系统安装教程图解)
  • 深度操作系统安装教程(深度操作系统安装教程图解)
  • 深度操作系统安装教程(深度操作系统安装教程图解)
  • 深度操作系统安装教程(深度操作系统安装教程图解)
win7旗舰版和专业版区别(win7旗舰版跟专业版)

1、功能区别:Win7旗舰版比专业版多了三个功能,分别是Bitlocker、BitlockerToGo和多语言界面; 2、用途区别:旗舰版的功能是所有版本中最全最强大的,占用的系统资源,...

万能连接钥匙(万能wifi连接钥匙下载)

1、首先打开wifi万能钥匙软件,若手机没有开启WLAN,就根据软件提示打开WLAN开关;2、打开WLAN开关后,会显示附近的WiFi,如果知道密码,可点击相应WiFi后点击‘输入密码’连接;3、若不...

雨林木风音乐叫什么(雨林木风是啥)

雨林木风的创始人是陈年鑫先生。陈年鑫先生于1999年创立了雨林木风公司,其初衷是为满足中国市场对高品质、高性能电脑的需求。在陈年鑫先生的领导下,雨林木风以技术创新、产品质量和客户服务为核心价值,不断推...

aics6序列号永久序列号(aics6破解序列号)

关于AICS6这个版本,虽然是比较久远的版本,但是在功能上也是十分全面和强大的,作为一名平面设计师的话,AICS6的现有的功能已经能够应付几乎所有的设计工作了……到底AICC2019的功能是不是...

win7正在启动windows 卡住(win7正在启动windows卡住了 进入安全模式)
  • win7正在启动windows 卡住(win7正在启动windows卡住了 进入安全模式)
  • win7正在启动windows 卡住(win7正在启动windows卡住了 进入安全模式)
  • win7正在启动windows 卡住(win7正在启动windows卡住了 进入安全模式)
  • win7正在启动windows 卡住(win7正在启动windows卡住了 进入安全模式)
手机可以装电脑系统吗(手机可以装电脑系统吗怎么装)

答题公式1:手机可以通过数据线或无线连接的方式给电脑装系统。手机安装系统需要一定的技巧和软件支持,一般需要通过数据线或无线连接的方式与电脑连接,并下载相应的软件和系统文件进行安装。对于大部分手机用户来...