一、gcc 內(nèi)聯(lián)匯編
內(nèi)聯(lián)匯編即在C中直接使用匯編語(yǔ)句進(jìn)行編程,使程序可以在C程序中實(shí)現(xiàn)C語(yǔ)言不能完成的一些工作,例如,在下面幾種情況中必須使用內(nèi)聯(lián)匯編或嵌入型匯編。
程序中使用飽和算術(shù)運(yùn)算(Saturating Arithmetic)
程序需要對(duì)協(xié)處理器進(jìn)行操作
在C程序中完成對(duì)程序狀態(tài)寄存器的操作
格式:
__asm____volatile__("asmcode" :output :input :changedregisters);
asm或__asm__開頭,小括號(hào)+分號(hào),括號(hào)內(nèi)容寫匯編指令。指令+ 用雙引號(hào)引上。
參數(shù)
「asm code」主要填寫匯編代碼:
"movr0,r0 " "movr1,r1 " "movr2,r2"
「output(asm->C)」用于定義輸出的參數(shù),通常只能是變量:
:"constraint"(variable) "constraint"用于定義variable的存放位置: r表示使用任何可用的寄存器 m表示使用變量的內(nèi)存地址 +可讀可寫 =只寫 &表示該輸出操作數(shù)不能使用輸入部分使用過的寄存器,只能用"+&"或"=&"的方式使用
「input(C->asm)」用于定義輸入的參數(shù),可以是變量也可以是立即數(shù):
:"constraint"(variable/immediate) "constraint"用于定義variable的存放位置: r表示使用任何可用的寄存器(立即數(shù)和變量都可以) m表示使用變量的內(nèi)存地址 i表示使用立即數(shù)
Note:
使用__asm__和__volatile__表示編譯器將不檢查后面的內(nèi)容,而是直接交給匯編器。
如果希望編譯器為你優(yōu)化,__volatile__可以不加
沒有asm code也不能省略""
沒有前面的和中間的部分,不可以相應(yīng)的省略:
沒有changed 部分,必須相應(yīng)的省略:
最后的;不能省略,對(duì)于C語(yǔ)言來(lái)說(shuō)這是一條語(yǔ)句
匯編代碼必須放在一個(gè)字符串內(nèi),且字符串中間不能直接按回車換行,可以寫成多個(gè)字符串,注意中間不能有任何符號(hào),這樣就會(huì)將兩個(gè)字符串合并為一個(gè)
指令之間必須要換行,還可以使用 使指令在匯編中保持整齊
舉例
例1:無(wú)參數(shù),無(wú)返回值這種情況,output和input可以省略:
asm (//匯編指令 "mrsr0,cpsr " "bicr0,r0,#0x80 " "msrcpsr,r0 " );
例2:有參數(shù) ,有返回值讓內(nèi)聯(lián)匯編做加法運(yùn)算,求a+b,結(jié)果存在c中
inta=100,b=200,c=0; asm ( "add%0,%1,%2 " :"=r"(c) :"r"(a),"r"(b) :"memory" );
%0 對(duì)應(yīng)變量c%1 對(duì)應(yīng)變量a%2 對(duì)應(yīng)變量b
例3:有參數(shù) 2 ,有返回值
讓內(nèi)聯(lián)匯編做加法運(yùn)算,求a+b,結(jié)果存在sum中,把a(bǔ)-b的存在d中
asmvolatile ( "add%[op1],%[op2],%[op3] " "sub%[op4],%[op2],%[op3] " :[op1]"=r"(sum),[op4]"=r"(d) :[op2]"r"(a),[op3]"r"(b) :"memory" );
%0 對(duì)應(yīng)變量c%1 對(duì)應(yīng)變量a%2 對(duì)應(yīng)變量b
三、ATPCS規(guī)則:(ARM、thumber程序調(diào)用規(guī)范)
為了使單獨(dú)編譯的C語(yǔ)言程序和匯編程序之間能夠相互調(diào)用,必須為子程序之間的調(diào)用規(guī)定一定的規(guī)則.ATPCS就是ARM程序和THUMB程序中子程序調(diào)用的基本規(guī)則。
基本ATPCS規(guī)定了在子程序調(diào)用時(shí)的一些基本規(guī)則,包括下面3方面的內(nèi)容:
各寄存器的使用規(guī)則及其相應(yīng)的名稱。
數(shù)據(jù)棧的使用規(guī)則。
參數(shù)傳遞的規(guī)則。
1. 寄存器的使用必須滿足下面的規(guī)則:
1)子程序間通過寄存器R0一R3來(lái)傳遞參數(shù),這時(shí),寄存器R0~R3可以記作A1-A4。被調(diào)用的子程序在返回前無(wú)需恢復(fù)寄存器R0~R3的內(nèi)容。
2)在子程序中,使用寄存器R4~R11來(lái)保存局部變量.這時(shí),寄存器 R4 ~ R11可以記作V1 ~ V8。如果在子程序中使用到了寄存器V1~V8中的某些寄存器,子程序進(jìn)入時(shí)必須保存這些寄存器的值,在返回前必須恢復(fù)這些寄存器的值;對(duì)于子程序中沒有用到的寄存器則不必進(jìn)行這些操作。在Thumb程序中,通常只能使用寄存器R4~R7來(lái)保存局部變量。
3)寄存器R12用作過程調(diào)用時(shí)的臨時(shí)寄存器(用于保存SP,在函數(shù)返回時(shí)使用該寄存器出棧), 記作ip。在子程序間的連接代碼段中常有這種使用規(guī)則。
4)寄存器R13用作數(shù)據(jù)棧指針,記作sp。在子程序中寄存器R13不能用作其他用途。寄存器sp在進(jìn)入子程序時(shí)的值和退出子程序時(shí)的值必須相等。
5)寄存器R14稱為連接寄存器,記作lr。它用于保存子程序的返回地址。如果在子程序中保存了返回地址,寄存器R14則可以用作其他用途。
6)寄存器R15是程序計(jì)數(shù)器,記作pc。它不能用作其他用途。
ATPCS下ARM寄存器的命名:
寄存器 | 別名 | 功能 |
---|---|---|
R0 | a1 | 工作寄存器 |
R1 | a2 | 工作寄存器 |
R2 | a3 | 工作寄存器 |
R3 | a4 | 工作寄存器 |
R4 | v1 | 必須保護(hù);局部變量寄存器 |
R5 | v2 | 必須保護(hù);局部變量寄存器 |
R6 | v3 | 必須保護(hù);局部變量寄存器 |
R7 | v4 | 必須保護(hù);局部變量寄存器 |
R8 | v5 | 必須保護(hù);局部變量寄存器 |
R9 | v6 | 必須保護(hù);局部變量寄存器 |
R10 | sl | 棧限制 |
R11 | fp | 幀指針 |
R12 | ip | 指令指針 |
R13 | sp | 棧指針 |
R14 | lr | 連接寄存器 |
2、堆棧使用規(guī)則:
ATPCS規(guī)定堆棧為FD類型,即滿遞減堆棧。并且堆棧的操作是8字節(jié)對(duì)齊。
而對(duì)于匯編程序來(lái)說(shuō),如果目標(biāo)文件中包含了外部調(diào)用,則必須滿足以下條件:
外部接口的數(shù)據(jù)棧一定是8位對(duì)齊的,也就是要保證在進(jìn)入該匯編代碼后,直到該匯編程序調(diào)用外部代碼之間,數(shù)據(jù)棧的棧指針變化為偶數(shù)個(gè)字;
在匯編程序中使用PRESERVE8偽操作告訴連接器,本匯編程序是8字節(jié)對(duì)齊的.
3、參數(shù)的傳遞規(guī)則:
根據(jù)參數(shù)個(gè)數(shù)是否固定,可以將子程序分為參數(shù)個(gè)數(shù)固定的子程序和參數(shù)個(gè)數(shù)可變的子程序.這兩種子程序的參數(shù)傳遞規(guī)則是不同的.
1.參數(shù)個(gè)數(shù)可變的子程序參數(shù)傳遞規(guī)則
對(duì)于參數(shù)個(gè)數(shù)可變的子程序,當(dāng)參數(shù)不超過4個(gè)時(shí),可以使用寄存器R0~R3來(lái)進(jìn)行參數(shù)傳遞,當(dāng)參數(shù)超過4個(gè)時(shí),還可以使用數(shù)據(jù)棧來(lái)傳遞參數(shù).
在參數(shù)傳遞時(shí),將所有參數(shù)看做是存放在連續(xù)的內(nèi)存單元中的字?jǐn)?shù)據(jù)。然后,依次將各名字?jǐn)?shù)據(jù)傳送到寄存器R0,R1,R2,R3; 如果參數(shù)多于4個(gè),將剩余的字?jǐn)?shù)據(jù)傳送到數(shù)據(jù)棧中,入棧的順序與參數(shù)順序相反,即最后一個(gè)字?jǐn)?shù)據(jù)先入棧.
按照上面的規(guī)則,一個(gè)浮點(diǎn)數(shù)參數(shù)可以通過寄存器傳遞,也可以通過數(shù)據(jù)棧傳遞,也可能一半通過寄存器傳遞,另一半通過數(shù)據(jù)棧傳遞。
舉例:
voidfunc(a,b,c,d,e) a--r0 b--r1 c--r2 d--r3 e--棧
2.參數(shù)個(gè)數(shù)固定的子程序參數(shù)傳遞規(guī)則
對(duì)于參數(shù)個(gè)數(shù)固定的子程序,參數(shù)傳遞與參數(shù)個(gè)數(shù)可變的子程序參數(shù)傳遞規(guī)則不同,如果系統(tǒng)包含浮點(diǎn)運(yùn)算的硬件部件。
浮點(diǎn)參數(shù)將按照下面的規(guī)則傳遞:(1)各個(gè)浮點(diǎn)參數(shù)按順序處理;(2)為每個(gè)浮點(diǎn)參數(shù)分配FP寄存器;
分配的方法是,滿足該浮點(diǎn)參數(shù)需要的且編號(hào)最小的一組連續(xù)的FP寄存器.第一個(gè)整數(shù)參數(shù)通過寄存器R0~R3來(lái)傳遞,其他參數(shù)通過數(shù)據(jù)棧傳遞.
3、子程序結(jié)果返回規(guī)則
1.結(jié)果為一個(gè)32位的整數(shù)時(shí),可以通過寄存器R0返回.
2.結(jié)果為一個(gè)64位整數(shù)時(shí),可以通過R0和R1返回,依此類推.
3.對(duì)于位數(shù)更多的結(jié)果,需要通過調(diào)用內(nèi)存來(lái)傳遞.
舉例:
使用r0 接收返回值
intfunc1(intm,intn) m--r0 n--r1 返回值給r0
「為什么有的編程規(guī)范要求自定義函數(shù)的參數(shù)不要超過4個(gè)?」答:因?yàn)閰?shù)超過4個(gè)就需要壓棧退棧,而壓棧退棧需要增加很多指令周期。對(duì)于參數(shù)比較多的情況,我們可以把數(shù)據(jù)封裝到結(jié)構(gòu)體中,然后傳遞結(jié)構(gòu)體變量的地址。
四、C語(yǔ)言和匯編相互調(diào)用
C和匯編相互調(diào)用要特別注意遵守相應(yīng)的ATPCS規(guī)則。
1. C調(diào)用匯編
例1:c調(diào)用匯編文件中函數(shù)帶返回值簡(jiǎn)化代碼如下,代碼架構(gòu)可以參考《7. 從0開始學(xué)ARM-GNU偽指令、代碼編譯,lds使用》。
;.asm add: addr2,r0,r1 movr0,r2 MOVpc,lr
main.c
externintadd(inta,intb); printf("%d ",add(2,3));
a->r0,b->r1
返回值通過r0返回計(jì)算結(jié)果給c代碼
例2,用匯編實(shí)現(xiàn)一個(gè)strcopy函數(shù)
;.asm .globalstrcopy strcopy:;R0指向目的字符串;R1指向源字符串 LDRBR2,[R1],#1;加載字字符并更新源字符串指針地址 STRBR2,[R0],#1;存儲(chǔ)字符并更新目的字符串指針地址 CMPR2,#0;判斷是否為字符串結(jié)尾 BNEstrcopy;如果不是,程序跳轉(zhuǎn)到strcopy繼續(xù)循環(huán) MOVpc,lr;程序返回//.c #include
2. 匯編調(diào)用C
//.c intfcn(inta,intb,intc,intd,inte) { returna+b+c+d+e; };.asm; .text.global_start _start: STRlr,[sp,#-4]!;保存返回地址lr ADDR1,R0,R0;計(jì)算2*i(第2個(gè)參數(shù)) ADDR2,R1,R0;計(jì)算3*i(第3個(gè)參數(shù)) ADDR3,R1,R2;計(jì)算5*i STRR3,[SP,#-4]!;第5個(gè)參數(shù)通過堆棧傳遞 ADDR3,R1,R1;計(jì)算4*i(第4個(gè)參數(shù)) BLfcn;調(diào)用C程序 ADDsp,sp,#4;從堆棧中刪除第五個(gè)參數(shù) .end
假設(shè)程序進(jìn)入f時(shí),R0中的值為i ;
intf(inti){ returnfcn(i,2*i,3*i,4*i,5*i); }
五、內(nèi)核實(shí)例
為了讓讀者有個(gè)更加深刻的理解, 以內(nèi)核中的例子為例:
arch/arm/kernel/setup.c
voidnotracecpu_init(void) { unsignedintcpu=smp_processor_id();----獲取CPUID structstack*stk=&stacks[cpu];----獲取該CPU對(duì)于的irqabt和und的stack指針 …… #ifdefCONFIG_THUMB2_KERNEL #definePLC"r"----Thumb-2下,msr指令不允許使用立即數(shù),只能使用寄存器。 #else #definePLC"I" #endif__asm__( "msrcpsr_c,%1 "----讓CPU進(jìn)入IRQmode "addr14,%0,%2 "----r14寄存器保存stk->irq "movsp,r14 "----設(shè)定IRQmode的stack為stk->irq "msrcpsr_c,%3 " "addr14,%0,%4 " "movsp,r14 "----設(shè)定abtmode的stack為stk->abt "msrcpsr_c,%5 " "addr14,%0,%6 " "movsp,r14 "----設(shè)定undmode的stack為stk->und "msrcpsr_c,%7"---回到SVCmode :----上面是code,下面的output部分是空的 :"r"(stk),----對(duì)應(yīng)上面代碼中的%0 PLC(PSR_F_BIT|PSR_I_BIT|IRQ_MODE),----對(duì)應(yīng)上面代碼中的%1 "I"(offsetof(structstack,irq[0])),----對(duì)應(yīng)上面代碼中的%2 PLC(PSR_F_BIT|PSR_I_BIT|ABT_MODE),----以此類推,下面不贅述 "I"(offsetof(structstack,abt[0])), PLC(PSR_F_BIT|PSR_I_BIT|UND_MODE), "I"(offsetof(structstack,und[0])), PLC(PSR_F_BIT|PSR_I_BIT|SVC_MODE) :"r14");----上面是input操作數(shù)列表,r14是要clobberedregister列表 }
責(zé)任編輯:lq
-
寄存器
+關(guān)注
關(guān)注
31文章
5434瀏覽量
124513 -
變量
+關(guān)注
關(guān)注
0文章
614瀏覽量
28962 -
匯編代碼
+關(guān)注
關(guān)注
0文章
24瀏覽量
7648
原文標(biāo)題:C和匯編如何互相調(diào)用?嵌入式工程師必須掌握
文章出處:【微信號(hào):mcu168,微信公眾號(hào):硬件攻城獅】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
匯編語(yǔ)言教學(xué)中文資料
Windows環(huán)境下32位匯編語(yǔ)言中文資料
rt-thread studio debug生成了elf & map,為什么不生成反匯編?
EE-134:為SHARC系列編寫C兼容匯編代碼中斷處理程序

EE-128:C語(yǔ)言中的DSP:從C調(diào)用匯編類成員函數(shù)

TMS320C6000匯編語(yǔ)言工具v7.4用戶指南

六博光電入編《中國(guó)船用設(shè)備匯編》:開啟船舶領(lǐng)域新征程

TMS320C6000匯編語(yǔ)言工具 v8.3.x

TMS320C28x匯編語(yǔ)言工具

嵌入式學(xué)習(xí)建議
TMS320LF240x DSP的C語(yǔ)言和匯編代碼快速入門

評(píng)論