一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你們知道計算機是如何識別你寫的代碼的嗎?

strongerHuang ? 來源:博客園阮一峰 ? 作者:博客園阮一峰 ? 2021-07-06 10:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

學(xué)習(xí)編程其實就是學(xué)高級語言,即那些為人類設(shè)計的計算機語言。

但是,計算機不理解高級語言,必須通過編譯器轉(zhuǎn)成二進制代碼,才能運行。學(xué)會高級語言,并不等于理解計算機實際的運行步驟。

計算機真正能夠理解的是低級語言,它專門用來控制硬件。匯編語言就是低級語言,直接描述/控制 CPU 的運行。如果你想了解 CPU 到底干了些什么,以及代碼的運行步驟,就一定要學(xué)習(xí)匯編語言。

匯編語言不容易學(xué)習(xí),就連簡明扼要的介紹都很難找到。下面我嘗試寫一篇最好懂的匯編語言教程,解釋 CPU 如何執(zhí)行代碼。

一、匯編語言是什么?我們知道,CPU 只負(fù)責(zé)計算,本身不具備智能。你輸入一條指令(instruction),它就運行一次,然后停下來,等待下一條指令。

這些指令都是二進制的,稱為操作碼(opcode),比如加法指令就是00000011。編譯器的作用,就是將高級語言寫好的程序,翻譯成一條條操作碼。

對于人類來說,二進制程序是不可讀的,根本看不出來機器干了什么。為了解決可讀性的問題,以及偶爾的編輯需求,就誕生了匯編語言。

匯編語言是二進制指令的文本形式,與指令是一一對應(yīng)的關(guān)系。比如,加法指令00000011寫成匯編語言就是 ADD。只要還原成二進制,匯編語言就可以被 CPU 直接執(zhí)行,所以它是最底層的低級語言。

二、來歷最早的時候,編寫程序就是手寫二進制指令,然后通過各種開關(guān)輸入計算機,比如要做加法了,就按一下加法開關(guān)。后來,發(fā)明了紙帶打孔機,通過在紙帶上打孔,將二進制指令自動輸入計算機。

為了解決二進制指令的可讀性問題,工程師將那些指令寫成了八進制。二進制轉(zhuǎn)八進制是輕而易舉的,但是八進制的可讀性也不行。很自然地,最后還是用文字表達,加法指令寫成 ADD。內(nèi)存地址也不再直接引用,而是用標(biāo)簽表示。

這樣的話,就多出一個步驟,要把這些文字指令翻譯成二進制,這個步驟就稱為 assembling,完成這個步驟的程序就叫做 assembler。它處理的文本,自然就叫做 aseembly code。標(biāo)準(zhǔn)化以后,稱為 assembly language,縮寫為 asm,中文譯為匯編語言。

每一種 CPU 的機器指令都是不一樣的,因此對應(yīng)的匯編語言也不一樣。本文介紹的是目前最常見的 x86 匯編語言,即 Intel 公司的 CPU 使用的那一種。

三、寄存器學(xué)習(xí)匯編語言,首先必須了解兩個知識點:寄存器和內(nèi)存模型。

先來看寄存器。CPU 本身只負(fù)責(zé)運算,不負(fù)責(zé)儲存數(shù)據(jù)。數(shù)據(jù)一般都儲存在內(nèi)存之中,CPU 要用的時候就去內(nèi)存讀寫數(shù)據(jù)。但是,CPU 的運算速度遠(yuǎn)高于內(nèi)存的讀寫速度,為了避免被拖慢,CPU 都自帶一級緩存和二級緩存?;旧希珻PU 緩存可以看作是讀寫速度較快的內(nèi)存。

但是,CPU 緩存還是不夠快,另外數(shù)據(jù)在緩存里面的地址是不固定的,CPU 每次讀寫都要尋址也會拖慢速度。因此,除了緩存之外,CPU 還自帶了寄存器(register),用來儲存最常用的數(shù)據(jù)。

也就是說,那些最頻繁讀寫的數(shù)據(jù)(比如循環(huán)變量),都會放在寄存器里面,CPU 優(yōu)先讀寫寄存器,再由寄存器跟內(nèi)存交換數(shù)據(jù)。

寄存器不依靠地址區(qū)分?jǐn)?shù)據(jù),而依靠名稱。每一個寄存器都有自己的名稱,我們告訴 CPU 去具體的哪一個寄存器拿數(shù)據(jù),這樣的速度是最快的。有人比喻寄存器是 CPU 的零級緩存。

四、寄存器的種類早期的 x86 CPU 只有8個寄存器,而且每個都有不同的用途?,F(xiàn)在的寄存器已經(jīng)有100多個了,都變成通用寄存器,不特別指定用途了,但是早期寄存器的名字都被保存了下來。

EAX

EBX

ECX

EDX

EDI

ESI

EBP

ESP

上面這8個寄存器之中,前面七個都是通用的。ESP 寄存器有特定用途,保存當(dāng)前 Stack 的地址(詳見下一節(jié))。

我們常??吹?32位 CPU、64位 CPU 這樣的名稱,其實指的就是寄存器的大小。32 位 CPU 的寄存器大小就是4個字節(jié)。

五、內(nèi)存模型:Heap寄存器只能存放很少量的數(shù)據(jù),大多數(shù)時候,CPU 要指揮寄存器,直接跟內(nèi)存交換數(shù)據(jù)。所以,除了寄存器,還必須了解內(nèi)存怎么儲存數(shù)據(jù)。

程序運行的時候,操作系統(tǒng)會給它分配一段內(nèi)存,用來儲存程序和運行產(chǎn)生的數(shù)據(jù)。這段內(nèi)存有起始地址和結(jié)束地址,比如從0x1000到0x8000,起始地址是較小的那個地址,結(jié)束地址是較大的那個地址。

程序運行過程中,對于動態(tài)的內(nèi)存占用請求(比如新建對象,或者使用malloc命令),系統(tǒng)就會從預(yù)先分配好的那段內(nèi)存之中,劃出一部分給用戶,具體規(guī)則是從起始地址開始劃分(實際上,起始地址會有一段靜態(tài)數(shù)據(jù),這里忽略)。

舉例來說,用戶要求得到10個字節(jié)內(nèi)存,那么從起始地址0x1000開始給他分配,一直分配到地址0x100A,如果再要求得到22個字節(jié),那么就分配到0x1020。

這種因為用戶主動請求而劃分出來的內(nèi)存區(qū)域,叫做 Heap(堆)。它由起始地址開始,從低位(地址)向高位(地址)增長。Heap 的一個重要特點就是不會自動消失,必須手動釋放,或者由垃圾回收機制來回收。

六、內(nèi)存模型:Stack除了 Heap 以外,其他的內(nèi)存占用叫做 Stack(棧)。簡單說,Stack 是由于函數(shù)運行而臨時占用的內(nèi)存區(qū)域。

請看下面的例子。

int main() {

int a = 2;

int b = 3;

}

上面代碼中,系統(tǒng)開始執(zhí)行main函數(shù)時,會為它在內(nèi)存里面建立一個幀(frame),所有main的內(nèi)部變量(比如a和b)都保存在這個幀里面。main函數(shù)執(zhí)行結(jié)束后,該幀就會被回收,釋放所有的內(nèi)部變量,不再占用空間。

如果函數(shù)內(nèi)部調(diào)用了其他函數(shù),會發(fā)生什么情況?

int main() {

int a = 2;

int b = 3;

return add_a_and_b(a, b);

}

上面代碼中,main函數(shù)內(nèi)部調(diào)用了add_a_and_b函數(shù)。執(zhí)行到這一行的時候,系統(tǒng)也會為add_a_and_b新建一個幀,用來儲存它的內(nèi)部變量。也就是說,此時同時存在兩個幀:main和add_a_and_b。一般來說,調(diào)用棧有多少層,就有多少幀。

等到add_a_and_b運行結(jié)束,它的幀就會被回收,系統(tǒng)會回到函數(shù)main剛才中斷執(zhí)行的地方,繼續(xù)往下執(zhí)行。通過這種機制,就實現(xiàn)了函數(shù)的層層調(diào)用,并且每一層都能使用自己的本地變量。

所有的幀都存放在 Stack,由于幀是一層層疊加的,所以 Stack 叫做棧。生成新的幀,叫做“入?!?,英文是 push;棧的回收叫做“出棧”,英文是 pop。

Stack 的特點就是,最晚入棧的幀最早出棧(因為最內(nèi)層的函數(shù)調(diào)用,最先結(jié)束運行),這就叫做“后進先出”的數(shù)據(jù)結(jié)構(gòu)。每一次函數(shù)執(zhí)行結(jié)束,就自動釋放一個幀,所有函數(shù)執(zhí)行結(jié)束,整個 Stack 就都釋放了。

Stack 是由內(nèi)存區(qū)域的結(jié)束地址開始,從高位(地址)向低位(地址)分配。比如,內(nèi)存區(qū)域的結(jié)束地址是0x8000,第一幀假定是16字節(jié),那么下一次分配的地址就會從0x7FF0開始;第二幀假定需要64字節(jié),那么地址就會移動到0x7FB0。

七、CPU 指令7.1 一個實例

了解寄存器和內(nèi)存模型以后,就可以來看匯編語言到底是什么了。下面是一個簡單的程序example.c。

int add_a_and_b(int a, int b) {

return a + b;

}

int main() {

return add_a_and_b(2, 3);

}

gcc 將這個程序轉(zhuǎn)成匯編語言。

$ gcc -S example.c

上面的命令執(zhí)行以后,會生成一個文本文件example.s,里面就是匯編語言,包含了幾十行指令。這么說吧,一個高級語言的簡單操作,底層可能由幾個,甚至幾十個 CPU 指令構(gòu)成。CPU 依次執(zhí)行這些指令,完成這一步操作。

example.s經(jīng)過簡化以后,大概是下面的樣子。

_add_a_and_b:

push %ebx

mov %eax, [%esp+8]

mov %ebx, [%esp+12]

add %eax, %ebx

pop %ebx

ret

_main:

push 3

push 2

call _add_a_and_b

add %esp, 8

ret

可以看到,原程序的兩個函數(shù)add_a_and_b和main,對應(yīng)兩個標(biāo)簽_add_a_and_b和_main。每個標(biāo)簽里面是該函數(shù)所轉(zhuǎn)成的 CPU 運行流程。

每一行就是 CPU 執(zhí)行的一次操作。它又分成兩部分,就以其中一行為例。

push %ebx

這一行里面,push是 CPU 指令,%ebx是該指令要用到的運算子。一個 CPU 指令可以有零個到多個運算子。

下面我就一行一行講解這個匯編程序,建議讀者最好把這個程序,在另一個窗口拷貝一份,省得閱讀的時候再把頁面滾動上來。

7.2 push 指令

根據(jù)約定,程序從_main標(biāo)簽開始執(zhí)行,這時會在 Stack 上為main建立一個幀,并將 Stack 所指向的地址,寫入 ESP 寄存器。后面如果有數(shù)據(jù)要寫入main這個幀,就會寫在 ESP 寄存器所保存的地址。

然后,開始執(zhí)行第一行代碼。

push 3

push指令用于將運算子放入 Stack,這里就是將3寫入main這個幀。

雖然看上去很簡單,push指令其實有一個前置操作。它會先取出 ESP 寄存器里面的地址,將其減去4個字節(jié),然后將新地址寫入 ESP 寄存器。使用減法是因為 Stack 從高位向低位發(fā)展,4個字節(jié)則是因為3的類型是int,占用4個字節(jié)。得到新地址以后, 3 就會寫入這個地址開始的四個字節(jié)。

push 2

第二行也是一樣,push指令將2寫入main這個幀,位置緊貼著前面寫入的3。這時,ESP 寄存器會再減去 4個字節(jié)(累計減去8)。

7.3 call 指令

第三行的call指令用來調(diào)用函數(shù)。

call _add_a_and_b

上面的代碼表示調(diào)用add_a_and_b函數(shù)。這時,程序就會去找_add_a_and_b標(biāo)簽,并為該函數(shù)建立一個新的幀。

下面就開始執(zhí)行_add_a_and_b的代碼。

push %ebx

這一行表示將 EBX 寄存器里面的值,寫入_add_a_and_b這個幀。這是因為后面要用到這個寄存器,就先把里面的值取出來,用完后再寫回去。

這時,push指令會再將 ESP 寄存器里面的地址減去4個字節(jié)(累計減去12)。

7.4 mov 指令

mov指令用于將一個值寫入某個寄存器。

mov %eax, [%esp+8]

這一行代碼表示,先將 ESP 寄存器里面的地址加上8個字節(jié),得到一個新的地址,然后按照這個地址在 Stack 取出數(shù)據(jù)。根據(jù)前面的步驟,可以推算出這里取出的是2,再將2寫入 EAX 寄存器。

下一行代碼也是干同樣的事情。

mov %ebx, [%esp+12]

上面的代碼將 ESP 寄存器的值加12個字節(jié),再按照這個地址在 Stack 取出數(shù)據(jù),這次取出的是3,將其寫入 EBX 寄存器。

7.5 add 指令

add指令用于將兩個運算子相加,并將結(jié)果寫入第一個運算子。

add %eax, %ebx

上面的代碼將 EAX 寄存器的值(即2)加上 EBX 寄存器的值(即3),得到結(jié)果5,再將這個結(jié)果寫入第一個運算子 EAX 寄存器。

7.6 pop 指令

pop指令用于取出 Stack 最近一個寫入的值(即最低位地址的值),并將這個值寫入運算子指定的位置。

pop %ebx

上面的代碼表示,取出 Stack 最近寫入的值(即 EBX 寄存器的原始值),再將這個值寫回 EBX 寄存器(因為加法已經(jīng)做完了,EBX 寄存器用不到了)。

注意,pop指令還會將 ESP 寄存器里面的地址加4,即回收4個字節(jié)。

7.7 ret 指令

ret指令用于終止當(dāng)前函數(shù)的執(zhí)行,將運行權(quán)交還給上層函數(shù)。也就是,當(dāng)前函數(shù)的幀將被回收。

ret

可以看到,該指令沒有運算子。

隨著add_a_and_b函數(shù)終止執(zhí)行,系統(tǒng)就回到剛才main函數(shù)中斷的地方,繼續(xù)往下執(zhí)行。

add %esp, 8

上面的代碼表示,將 ESP 寄存器里面的地址,手動加上8個字節(jié),再寫回 ESP 寄存器。這是因為 ESP 寄存器的是 Stack 的寫入開始地址,前面的pop操作已經(jīng)回收了4個字節(jié),這里再回收8個字節(jié),等于全部回收。

ret

最后,main函數(shù)運行結(jié)束,ret指令退出程序執(zhí)行。

看完這篇文章,你對匯編語言有什么了解了嗎,看嘛,匯編也不難~

原文鏈接:

http://www.ruanyifeng.com/blog/2018/01/assembly-language-primer.html

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11074

    瀏覽量

    216907
  • 編程
    +關(guān)注

    關(guān)注

    88

    文章

    3689

    瀏覽量

    95189
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1661

    瀏覽量

    50177
  • 儲存
    +關(guān)注

    關(guān)注

    3

    文章

    202

    瀏覽量

    22714

原文標(biāo)題:計算機怎么識別你寫的代碼?

文章出處:【微信號:strongerHuang,微信公眾號:strongerHuang】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    什么是模塊化計算機?搞清楚用途和應(yīng)用場景,別再瞎選了!

    如果是搞工業(yè)自動化、醫(yī)療設(shè)備、交通控制,甚至是軍事裝備的,那你大概率已經(jīng)聽過“模塊化計算機”這個詞。要是還沒了解,那這篇文章就是為
    的頭像 發(fā)表于 06-04 11:00 ?327次閱讀
    什么是模塊化<b class='flag-5'>計算機</b>?搞清楚用途和應(yīng)用場景,別再瞎選了!

    云端超級計算機使用教程

    云端超級計算機是一種基于云計算的高性能計算服務(wù),它將大量計算資源和存儲資源集中在一起,通過網(wǎng)絡(luò)向用戶提供按需的計算服務(wù)。下面,AI部落小編為
    的頭像 發(fā)表于 12-17 10:19 ?545次閱讀

    工業(yè)中使用哪種計算機?

    在工業(yè)環(huán)境中,工控機被廣泛使用。這些計算機的設(shè)計可承受極端溫度、灰塵和振動等惡劣條件。它們比標(biāo)準(zhǔn)消費類計算機更耐用、更可靠。工業(yè)計算機可控制機器、監(jiān)控流程并實時收集數(shù)據(jù)。其堅固的結(jié)構(gòu)和專業(yè)功能
    的頭像 發(fā)表于 11-29 14:07 ?698次閱讀
    工業(yè)中使用哪種<b class='flag-5'>計算機</b>?

    量子計算機與普通計算機工作原理的區(qū)別

    ? 本文介紹了量子計算機與普通計算機工作原理的區(qū)別。 量子計算是一個新興的研究領(lǐng)域,科學(xué)家們利用量子力學(xué),制造出具有革命性能力的計算機。雖然現(xiàn)在的量子
    的頭像 發(fā)表于 11-24 11:00 ?1455次閱讀
    量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機</b>工作原理的區(qū)別

    工業(yè)計算機類型介紹

    工業(yè)領(lǐng)域沒有計算機的世界就像沒有管弦樂隊的交響樂,缺乏實現(xiàn)最佳性能所需的和諧和精確度。計算機徹底改變了工業(yè)的運作方式,將效率、準(zhǔn)確性和創(chuàng)新推向了新的高度。事實上,根據(jù)最近在印度進行的一項研究
    的頭像 發(fā)表于 11-04 15:56 ?658次閱讀
    工業(yè)<b class='flag-5'>計算機</b>類型介紹

    ROM對計算機性能的影響

    是一種非易失性存儲器,即使在斷電的情況下也能保持?jǐn)?shù)據(jù)不丟失。它通常用于存儲固件,這些固件是計算機啟動和運行操作系統(tǒng)所必需的。ROM的內(nèi)容在制造過程中被寫入,并且通常不能被用戶更改。 ROM的類型 PROM(可編程ROM) :用戶可以通過特殊的編程設(shè)備
    的頭像 發(fā)表于 11-04 10:31 ?1200次閱讀

    日男子用AI造計算機病毒被判 生成式AI的管控待加強

    因利用人工智能制造計算機病毒而被定罪,盡管該男子沒有專業(yè)的IT編程技能;但是他用生成AI編寫了計算機病毒源代碼,差一點就被付諸現(xiàn)實;被批捕后判處有期徒刑3年,緩刑4年。 該法院判例可能是日本首例因濫用生成式AI而在刑事案件中被判
    的頭像 發(fā)表于 10-28 15:32 ?715次閱讀

    計算機接口位于什么之間

    計算機接口是計算機硬件和軟件之間、計算機與外部設(shè)備之間以及計算機各部件之間傳輸數(shù)據(jù)、控制信息和狀態(tài)信息的硬件設(shè)備和軟件程序。它在計算機系統(tǒng)中
    的頭像 發(fā)表于 10-14 14:02 ?1295次閱讀

    計算機存儲系統(tǒng)的構(gòu)成

    計算機存儲系統(tǒng)是計算機中用于存放程序和數(shù)據(jù)的設(shè)備或部件的集合,它構(gòu)成了計算機信息處理的基礎(chǔ)。一個完整的計算機存儲系統(tǒng)通常包括多個層次的存儲器,從高速緩存(Cache)到主存儲器(Mai
    的頭像 發(fā)表于 09-26 15:25 ?2517次閱讀

    簡述計算機總線的分類

    計算機總線作為計算機系統(tǒng)中連接各個功能部件的公共通信干線,其結(jié)構(gòu)和分類對于理解計算機硬件系統(tǒng)的工作原理至關(guān)重要。以下是對計算機總線結(jié)構(gòu)和分類的詳細(xì)闡述,內(nèi)容將涵蓋總線的基本概念、內(nèi)部結(jié)
    的頭像 發(fā)表于 08-26 16:23 ?5145次閱讀

    晶體管計算機和電子管計算機有什么區(qū)別

    晶體管計算機和電子管計算機作為計算機發(fā)展史上的兩個重要階段,它們在多個方面存在顯著的區(qū)別。以下是對這兩類計算機在硬件、性能、應(yīng)用以及技術(shù)發(fā)展等方面區(qū)別的詳細(xì)闡述。
    的頭像 發(fā)表于 08-23 15:28 ?3573次閱讀

    晶體管計算機的誕生和特點

    晶體管計算機的誕生標(biāo)志著計算機技術(shù)的一個重要里程碑,它不僅推動了計算機硬件的革新,還促進了計算機軟件技術(shù)的發(fā)展。以下是對晶體管計算機誕生及其
    的頭像 發(fā)表于 08-23 15:06 ?4198次閱讀

    計算機系統(tǒng)的組成和功能

    計算機系統(tǒng)是一個復(fù)雜而龐大的概念,它涵蓋了計算機硬件、軟件以及它們之間相互作用的所有元素。為了全面而深入地探討計算機系統(tǒng),本文將從定義、組成、功能、發(fā)展歷程以及未來趨勢等方面進行詳細(xì)闡述。
    的頭像 發(fā)表于 07-24 17:41 ?2378次閱讀

    DRAM在計算機中的應(yīng)用

    DRAM(Dynamic Random Access Memory,動態(tài)隨機存取存儲器)在計算機系統(tǒng)中扮演著至關(guān)重要的角色。它是一種半導(dǎo)體存儲器,用于存儲和快速訪問數(shù)據(jù),是計算機主內(nèi)存的主要組成部分。以下是對DRAM在計算機中的
    的頭像 發(fā)表于 07-24 17:04 ?2967次閱讀

    機器視覺和計算機視覺有什么區(qū)別

    機器視覺和計算機視覺是兩個密切相關(guān)但又有所區(qū)別的概念。 一、定義 機器視覺 機器視覺,又稱為計算機視覺,是指利用計算機、圖像處理技術(shù)和人工智能技術(shù),使機器能夠感知、識別、分析和理解圖像
    的頭像 發(fā)表于 07-16 10:23 ?1152次閱讀