一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

i.MXRT上提升代碼執(zhí)行性能的十八般武藝

GReq_mcu168 ? 來源:痞子衡嵌入式 ? 作者:痞子衡嵌入式 ? 2022-05-23 09:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


今天給大家介紹的是在串口波特率識別實(shí)例里逐步展示i.MXRT上提升代碼執(zhí)行性能的十八般武藝

恩智浦 MCU SE 團(tuán)隊(duì)近期一直在加班加點(diǎn)趕 SBL 項(xiàng)目(解決客戶產(chǎn)品 OTA 需求),這個項(xiàng)目里集成了 ISP 本地升級(UART/USB)功能,其中 UART 口下載升級實(shí)現(xiàn)里加入了自動波特率識別支持,具體識別方法見 《串口(UART)自動波特率識別程序設(shè)計(jì)與實(shí)現(xiàn)(中斷)》 一文,這一套 ISP 代碼其實(shí)是移植于 i.MXRT Flashloader(更早期的時候叫 KBOOT)。

ISP 代碼放在 SBL 工程里會出現(xiàn)高波特率(比如115200)無法識別的問題,但在低波特率的情況下(比如9600,19200),ISP 代碼是功能正常的,說明代碼本身并不存在邏輯缺陷,但高波特率下就異常了,大概率是遇到了代碼執(zhí)行性能瓶頸。今天痞子衡就嘗試在 i.MXRT 上使用各種方法去提升性能來解決這個高波特率無法識別問題:

一、SBL項(xiàng)目里ISP串口高波特率識別問題

SBL 項(xiàng)目是支持全系列 i.MXRT 平臺的,為了具體化問題,我們就選取 i.MXRT1062 型號為例,官方配套 MIMXRT1060-EVK 板子上搭配了一顆四線串行 NOR Flash(芯成IS25WP064A)用于存放代碼。

SBL 程序主體是 XIP 執(zhí)行的,僅部分涉及 IAP 操作的代碼被分散加載到了 RAM 里。SBL 中 ISP 功能代碼主體當(dāng)然也是 XIP 為主,且在 SBL 程序里是最先執(zhí)行的(本地升級超時后才進(jìn)入 SBL 主體),SBL 工程里跟串口波特率識別相關(guān)的源文件一共如下三個:

microseconds_pit.c                 -- 存放 PIT 計(jì)時函數(shù)
autobaud_irq.c                     -- 存放 GPIO 中斷回調(diào)、波特率識別計(jì)算函數(shù)
pinmux_utility_imxrt_series.c      -- 存放 GPIO 配置與中斷處理函數(shù)

MIMXRT1060-EVK 板子上串口是 GPIO1[13:12],其中 RXD - GPIO1[13] 是核心的用于波特率識別的引腳,為了便于直觀地感受代碼執(zhí)行性能,我們用另一個 GPIO1[12] 來輔助,將其配置為 GPIO 輸出模式,初值為高電平,在 GPIO 中斷處理函數(shù)里保持低電平來標(biāo)示執(zhí)行總時間:

voidGPIO1_Combined_0_15_IRQHandler(void)
{
//****輔助調(diào)試:進(jìn)入中斷時拉低 GPIO1[12],標(biāo)志執(zhí)行時間起點(diǎn)
GPIO1->DR&=(uint32_t)~(1U<12);

uint32_tinterrupt_flag=(1U<13);
//僅當(dāng)GPIO1[13]下降沿中斷發(fā)生時
if((GPIO_GetPinsInterruptFlags(GPIO1)&interrupt_flag)&&s_pin_irq_func)
{
//執(zhí)行一次回調(diào)函數(shù)
s_pin_irq_func();
//清除GPIO1[13]中斷標(biāo)志
GPIO_ClearPinsInterruptFlags(GPIO1,interrupt_flag);
__DSB();
}

//****輔助調(diào)試:退出中斷時拉高 GPIO1[12],標(biāo)志執(zhí)行時間結(jié)束
GPIO1->DR|=(1U<12);
}

現(xiàn)在我們用示波器同時抓取 GPIO1[13:12] 信號,分別測試 9600 低波特率(下圖一)和 115200 高波特率(下圖二)下實(shí)際波形,根據(jù)測量第一次 GPIO 中斷處理執(zhí)行時間大概是 32.8us(7 次中斷因代碼分支執(zhí)行不同略有區(qū)別),這個時間對于 9600 波特率下單 bit 傳輸耗時約 104us 的情況來說是足夠快的,但是對于 115200 波特率下單 bit 傳輸耗時約 8.68us 的情況來說就顯得有點(diǎn)慢了(最小的下降沿之間間隔是 2bit 傳輸耗時 17.36us ),這也是 115200 無法被識別的原因,因?yàn)橛?4 個下降沿中斷被漏掉了。

8f7058c4-d8a3-11ec-ba43-dac502259ad0.png

8f9b973c-d8a3-11ec-ba43-dac502259ad0.png
  • Note: ISP 功能代碼里配置的系統(tǒng)環(huán)境是:396MHz CPU 主頻、不使能 L1 Cache、100MHz Flash 工作頻率,普通 SPI 下 Fast Read Quad I/O SDR Non-Continuous 工作模式,并且使能了 FlexSPI 的 Prefetch 特性(AHB RX Buffer 為 1KB)。

二、提升代碼性能的多種方法

既然代碼執(zhí)行性能不夠,那就努力提升性能,文章標(biāo)題叫十八般武藝,這只是一種夸張說法,不過痞子衡確實(shí)收集了如下六種提升性能的方法,讓我們一一嘗試吧,注意下述結(jié)果都是疊加前面方法而得的(所有測試均是在 115200 波特率下進(jìn)行)。

Level 1:提升CPU主頻

ISP 功能代碼里配置的 CPU 主頻是 396MHz,實(shí)際上這是根據(jù) BootROM 默認(rèn)運(yùn)行配置而來的,而 i.MXRT1062 是可以跑到 600MHz 主頻的,將 SDK 代碼里 armPllConfig_BOARD_BootClockRUN.loopDivider 由 66 調(diào)大到 100 即可。

constclock_arm_pll_config_tarmPllConfig_BOARD_BootClockRUN={
.loopDivider=100,/*PLLloopdivider,Fout=Fin*50*/
.src=0,/*Bypassclocksource,0-OSC24M,1-CLK1_PandCLK1_N*/
};

voidBOARD_BootClockRUN(void)
{
//...

CLOCK_SetDiv(kCLOCK_AhbDiv,0);
CLOCK_SetDiv(kCLOCK_ArmDiv,1);
CLOCK_InitArmPll(&armPllConfig_BOARD_BootClockRUN);
CLOCK_SetMux(kCLOCK_PrePeriphMux,3);
CLOCK_SetMux(kCLOCK_PeriphMux,0);

//...
}

CPU 主頻提升后第一次 GPIO 中斷處理執(zhí)行時間從 32.8us 下降到了 32.2us,性能僅有微小提升,看來此時主要性能瓶頸不在 CPU 主頻上,應(yīng)該是 Flash 訪問性能在拖后腿。

8fb7324e-d8a3-11ec-ba43-dac502259ad0.png

Level 2:提升Flash訪問速度

SBL 工程里啟動頭 FDCB 配置的是 100MHz Flash 工作頻率,但 MIMXRT1060-EVK 板載 Flash(芯成IS25WP064A)最大工作頻率是 133MHz,所以我們可以提升 Flash 工作頻率。修改 qspiflash_config.memConfig.serialClkFreq 為 kFlexSpiSerialClk_133MHz 即可。不了解 FDCB 結(jié)構(gòu)體工作機(jī)制的可以翻閱痞子衡舊文 《從頭開始認(rèn)識i.MXRT啟動頭FDCB里的lookupTable》 。

constflexspi_nor_config_tqspiflash_config={
.memConfig=
{
.tag=FLEXSPI_CFG_BLK_TAG,
.version=FLEXSPI_CFG_BLK_VERSION,
.readSampleClkSrc=kFlexSPIReadSampleClk_LoopbackFromDqsPad,
.csHoldTime=3u,
.csSetupTime=3u,
.sflashPadType=kSerialFlash_4Pads,
//.serialClkFreq=kFlexSpiSerialClk_100MHz,

.serialClkFreq=kFlexSpiSerialClk_133MHz,
.sflashA1Size=8u*1024u*1024u,
.lookupTable=
{
FLEXSPI_LUT_SEQ(CMD_SDR,FLEXSPI_1PAD,0xEB,RADDR_SDR,FLEXSPI_4PAD,0x18),
FLEXSPI_LUT_SEQ(DUMMY_SDR,FLEXSPI_4PAD,0x06,READ_SDR,FLEXSPI_4PAD,0x04),
},
},
.pageSize=256u,
.sectorSize=4u*1024u,
.blockSize=64u*1024u,
.isUniformBlockSize=false,
};

Flash 工作頻率提升后第一次 GPIO 中斷處理執(zhí)行時間從 32.2us 下降到了 27.8us,這次的性能提升算有點(diǎn)明顯了,但是還是不夠,解決不了問題。

8fda8bf4-d8a3-11ec-ba43-dac502259ad0.png

Level 3:配置FlexSPI至最優(yōu)模式

讓我們繼續(xù)從 Flash 傳輸模式上做文章,ISP 功能代碼里配置的是普通 SPI 下 Fast Read Quad I/O SDR Non-Continuous 工作模式,這個模式已經(jīng)算是非常高效的傳輸模式了,如果還想改進(jìn),要么是切換到 QPI 模式(將 CMD 子序列也從一線變到四線)要么是使能 Continuous Read(除了第一個 CMD 子序列,其后 CMD 子序列全部省掉),綜合考慮應(yīng)該是使能 Continuous Read 性能提升更大一些,具體方法參考 《在i.MXRT啟動頭FDCB里使能串行NOR Flash的Continuous read模式》

constflexspi_nor_config_tqspiflash_config={
.memConfig=
{
//...
.lookupTable=
{
FLEXSPI_LUT_SEQ(CMD_SDR,FLEXSPI_1PAD,0xEB,RADDR_SDR,FLEXSPI_4PAD,0x18),
//FLEXSPI_LUT_SEQ(DUMMY_SDR,FLEXSPI_4PAD,0x06,READ_SDR,FLEXSPI_4PAD,0x04),

//插入JUMP_ON_CS子序列
FLEXSPI_LUT_SEQ(MODE8_SDR,FLEXSPI_4PAD,0xA0,DUMMY_SDR,FLEXSPI_4PAD,0x04),
FLEXSPI_LUT_SEQ(READ_SDR,FLEXSPI_4PAD,0x04,JMP_ON_CS,FLEXSPI_1PAD,0x01),
},
},
//...
};

使能 Flash Continuous Read 后第一次 GPIO 中斷處理執(zhí)行時間從 27.8us 下降到了 27.4us,性能僅有微小提升,這應(yīng)該跟我們使能了 FlexSPI prefetch 特性有關(guān),1KB AHB RX Buffer 的存在導(dǎo)致 CMD 子序列在總傳輸時序中占比不明顯。不過有點(diǎn)收獲的是漏掉的下降沿中斷從 4 個減少到了 3 個。

8ff4c910-d8a3-11ec-ba43-dac502259ad0.png

Level 4:打開L1 Cache

對于 XIP 工程來說,不開 L1 I-Cache 加速性能是非常吃虧的一件事,i.MXRT1062 內(nèi)部有 32KB I-Cache,不把這個 Cache 用起來簡直是暴殄天物。雖然工程 SystemInit() 函數(shù)里會執(zhí)行一次 SCB_EnableICache(),但這只是一個 Cache 總開關(guān),要想 Cache 對 Flash 映射地址(0x60000000 之后)產(chǎn)生作用還得借助 BOARD_ConfigMPU() 函數(shù)來具體配置 MPU。關(guān)于 Cache 對 Flash 讀取的性能提升見 《實(shí)抓Flash信號波形來看i.MXRT的FlexSPI外設(shè)下AHB讀訪問情形(全加速)》 。

intmain(void)
{
//將MPU配置提到ISP代碼之前
BOARD_ConfigMPU();

#if(defined(COMPONENT_MCU_ISP))
boolisInfiniteIsp=false;
isp_boot_main(isInfiniteIsp);
#endif

//BOARD_ConfigMPU();
//...
}

使能 Cache 后第一次 GPIO 中斷處理執(zhí)行時間從 27.4us 下降到了 19us,后面的 GPIO 中斷執(zhí)行耗時更是大大縮短(原因是中斷處理函數(shù)相關(guān)代碼在第一次中斷觸發(fā)執(zhí)行時被順便放到 Cache 里了),這時候 115200 高波特率已經(jīng)能夠被正常識別了。

901ca9c6-d8a3-11ec-ba43-dac502259ad0.png

到這里問題已經(jīng)解決了,但我們還沒有榨干 MCU 最后一滴血,優(yōu)化繼續(xù)。上圖波形里第一次 GPIO 中斷處理執(zhí)行時間相比其后面的 6 次中斷執(zhí)行耗時要明顯長,這還是有風(fēng)險(xiǎn)的,比如再高的波特率 256000 還是無法正常識別(至少第一次識別會失敗,后面上位機(jī)再重復(fù)發(fā)暗號做第二次識別就可以了)。為了讓第一次 GPIO 中斷處理時間也大大縮短,我們可以在系統(tǒng)初始化的時候故意調(diào)用一下這些中斷處理相關(guān)函數(shù),將這些代碼事先裝載到 I-Cache里。

voidautobaud_init(void)
{
s_transitionCount=0;
s_firstByteTotalTicks=0;
s_secondByteTotalTicks=0;
s_lastToggleTicks=0;
s_ticksBetweenFailure=microseconds_convert_to_ticks(kMaximumTimeBetweenFallingEdges);
enable_autobaud_pin_irq(pin_transition_callback);

//故意調(diào)用一下,讓I-Cache事先將代碼Cache住
GPIO1_Combined_0_15_IRQHandler();
pin_transition_callback();//即第一節(jié)代碼中的s_pin_irq_func()
}

將中斷處理函數(shù)相關(guān)代碼預(yù)裝載到 I-Cache 后第一次 GPIO 中斷處理執(zhí)行時間從 19us 銳降到了 2.12us,跟其他中斷處理執(zhí)行差不多的耗時,現(xiàn)在即使是 256000 高波特率也能一次識別成功。

902c3e9a-d8a3-11ec-ba43-dac502259ad0.png

90497afa-d8a3-11ec-ba43-dac502259ad0.png

Level 5:拷貝到TCM里

靠 Cache 這種無法精準(zhǔn)控制的優(yōu)化策略始終讓我們無法放心,還是將中斷處理相關(guān)代碼直接放到 TCM 里更可靠,我們在工程鏈接文件(MIMXRT1062xxxxx_flexspi_nor.icf)里做如下修改將第一節(jié)里列出了三個源文件全部弄到 RAM 區(qū)里執(zhí)行(對于 XIP 工程來說,RAM 區(qū)是 DTCM, 當(dāng)然對于代碼來說 ITCM 效率要更高,不過 DTCM 也夠用了)。

initialize by copy {
  readwrite,
  /* Place in RAM flash and performance dependent functions */

  object microseconds_pit.o,
  object autobaud_irq.o,
  object pinmux_utility_imxrt_series.o,

  // ...
  section .textrw
};

do not initialize  { section .noinit };

將中斷處理函數(shù)相關(guān)代碼重定位到 DTCM 執(zhí)行后第一次 GPIO 中斷處理執(zhí)行時間從 2.12us 再降到了 520ns,這下 1M 超高波特率也能被識別了。

90684d4a-d8a3-11ec-ba43-dac502259ad0.png

9089337a-d8a3-11ec-ba43-dac502259ad0.png

Level 6:指定函數(shù)地址以八字節(jié)對齊

性能提升結(jié)束了嗎?痞子衡還有一招,參見 《鏈接函數(shù)到8字節(jié)對齊地址或可進(jìn)一步提升i.MXRT1xxx內(nèi)核執(zhí)行性能》 一文,將中斷處理相關(guān)函數(shù)全部鏈接到八字節(jié)對齊地址還可以再利用 Cortex-M7 內(nèi)核指令雙發(fā)射特性。我們查看下工程映射文件(sbl.map),三個相關(guān)函數(shù)僅有計(jì)時函數(shù) microseconds_get_ticks() 被自動分配到了八字節(jié)對齊的地址,其他兩個函數(shù)不是,所以還有提升空間。

Entry                       Address   Size  Type      Object
;----                       -------   ----  ----      ------

GPIO1_Combined_0_15_IRQHandler
                        0x2000'0b2f   0x3e  Code  Gb  pinmux_utility_imxrt_series.o [1]
pin_transition_callback 0x2000'0175   0x8e  Code  Gb  autobaud_irq.o [1]
microseconds_get_ticks  0x2000'08e9   0x22  Code  Gb  microseconds_pit.o [1]

將非八字節(jié)地址對齊的中斷處理相關(guān)函數(shù)調(diào)整到八字節(jié)地址對齊后(具體方法這里就不展開介紹了),第一次 GPIO 中斷處理執(zhí)行時間從 520ns 降到了 480ns,這幾乎是性能極限了。

90b3e4d0-d8a3-11ec-ba43-dac502259ad0.png

至此,在串口波特率識別實(shí)例里逐步展示i.MXRT上提升代碼執(zhí)行性能的十八般武藝痞子衡便介紹完畢了,掌聲在哪里~~~

審核編輯 :李倩


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 波特率
    +關(guān)注

    關(guān)注

    2

    文章

    313

    瀏覽量

    34964
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4900

    瀏覽量

    70779

原文標(biāo)題:提升MCU代碼執(zhí)行性能的十八般武藝

文章出處:【微信號:mcu168,微信公眾號:硬件攻城獅】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    戴爾PowerEdge R7715服務(wù)器性能評測

    數(shù)據(jù)中心越來越“卷”,服務(wù)器也要“十八般武藝”,核心要多,內(nèi)存要快,接口要新,功耗還得低?這聽起來像“不可能三角”,但戴爾PowerEdge R7715,用一臺機(jī)架,給出一體解法。
    的頭像 發(fā)表于 06-26 17:48 ?500次閱讀
    戴爾PowerEdge R7715服務(wù)器<b class='flag-5'>性能</b>評測

    十八I2C通信測試

    本章介紹了I2C協(xié)議,其物理層用SDA和SCL雙線,支持多設(shè)備:協(xié)議層含起始/停止信號、應(yīng)答機(jī)制等。還講解W55MH32的I2C外設(shè)及初始化,并進(jìn)行了通信測試代碼的分析。
    的頭像 發(fā)表于 06-19 17:07 ?559次閱讀
    第<b class='flag-5'>十八</b>章 <b class='flag-5'>I</b>2C通信測試

    多個i.MXRT共享一顆Flash啟動的方法與實(shí)踐(下)

    在 《多個i.MXRT共享一顆Flash啟動的方法與實(shí)踐()》 一文里痞子衡給大家從理論介紹一種多 i.MXRT 共享 Flash 啟動的方法,但是理論雖好,如果沒有經(jīng)過實(shí)踐驗(yàn)證切
    的頭像 發(fā)表于 06-05 10:04 ?536次閱讀
    多個<b class='flag-5'>i.MXRT</b>共享一顆Flash啟動的方法與實(shí)踐(下)

    多個i.MXRT共享一顆Flash啟動的方法與實(shí)踐()

    有些客戶應(yīng)用會采用多顆 i.MXRT 芯片設(shè)計(jì)一主多從的硬件架構(gòu)(目的不一,或仿多核 MCU 系統(tǒng)、或拓展 GPIO 數(shù)量),因?yàn)?i.MXRT 片內(nèi)無非易失性存儲器,這時候?yàn)檎麄€系統(tǒng)配置合適的啟動設(shè)備保證每個 i.MXRT
    的頭像 發(fā)表于 06-05 10:01 ?533次閱讀
    多個<b class='flag-5'>i.MXRT</b>共享一顆Flash啟動的方法與實(shí)踐(<b class='flag-5'>上</b>)

    快手上線鴻蒙應(yīng)用高性能解決方案:數(shù)據(jù)反序列化性能提升90%

    “class-transformer”的使用代碼即可實(shí)現(xiàn)性能優(yōu)化,既保持了對原有開發(fā)模式的兼容性,又大幅提升了運(yùn)行效率,整體改造過程無侵入、低成本、低風(fēng)險(xiǎn),適用于已有項(xiàng)目的快速集成與上線。 在實(shí)際應(yīng)用中
    發(fā)表于 05-15 10:01

    低壓智能綜合配電箱:現(xiàn)代電力系統(tǒng)的神奇小管家

    嘿呀,在如今這復(fù)雜得像大迷宮一樣的現(xiàn)代電力系統(tǒng)里,有個 “家伙” 那可是相當(dāng)重要,它就是低壓智能綜合配電箱。這玩意兒可不簡單,簡直就像個擁有十八般武藝的超級英雄,集成了一堆超厲害的功能,給電力的分配
    的頭像 發(fā)表于 04-27 17:41 ?326次閱讀

    主從系統(tǒng)中i.MXRT系列MCU從主處理器接收App數(shù)據(jù)包超時機(jī)制

    i.MXRT內(nèi)置ROM程序配套的與主機(jī)交互方法,有如下三種。其中方法一是比較常用的,把PC當(dāng)作主機(jī),因?yàn)閁ART/USB接口可以直接從PC引出,這種方式一集成在上位機(jī)GUI工具里(比如恩智浦官方
    的頭像 發(fā)表于 04-17 10:54 ?1110次閱讀
    主從系統(tǒng)中<b class='flag-5'>i.MXRT</b>系列MCU從主處理器接收App數(shù)據(jù)包超時機(jī)制

    i.MX RT 1176正常運(yùn)行代碼時與使用IAR調(diào)試代碼時存在一些奇怪的差異,為什么?

    我在 i.MX RT 1176 正常運(yùn)行代碼時的行為與使用 IAR 調(diào)試代碼時的行為之間存在一些奇怪的差異,并注意到這是由于堆棧指針的初始化方式造成的。 我的重置向量表將其指向 D
    發(fā)表于 03-17 07:26

    MWC 2025|美格智能發(fā)布行業(yè)首款48 TOPS高算力5G智能座艙模組,加速車載AI智能體駛向未來

    前言:2024年我國新能源汽車產(chǎn)銷量分別達(dá)1288.8萬輛和1286.6萬輛,同比分別增長34.4%和35.5%,汽車產(chǎn)業(yè)加快轉(zhuǎn)型步伐。新能源汽車產(chǎn)業(yè)競爭進(jìn)入白熱化階段,各大品牌紛紛亮出十八般武藝
    的頭像 發(fā)表于 03-06 15:38 ?880次閱讀
    MWC 2025|美格智能發(fā)布行業(yè)首款48 TOPS高算力5G智能座艙模組,加速車載AI智能體駛向未來

    AN-840: 通過I2C接口更新代碼

    電子發(fā)燒友網(wǎng)站提供《AN-840: 通過I2C接口更新代碼.pdf》資料免費(fèi)下載
    發(fā)表于 01-15 16:04 ?0次下載
    AN-840: 通過<b class='flag-5'>I</b>2C接口更新<b class='flag-5'>代碼</b>

    怎么提升單片機(jī)代碼執(zhí)行效率

    ? 提升單片機(jī)代碼執(zhí)行效率需要從多個方面入手,包括代碼優(yōu)化、硬件資源利用、編譯器設(shè)置、中斷處理優(yōu)化以及其他技巧等。在實(shí)際應(yīng)用中,需要根據(jù)具體需求和硬件條件綜合考慮這些因素,以實(shí)現(xiàn)
    的頭像 發(fā)表于 01-10 11:06 ?598次閱讀

    Triton編譯器如何提升編程效率

    在現(xiàn)代軟件開發(fā)中,編譯器扮演著至關(guān)重要的角色。它們不僅將高級語言代碼轉(zhuǎn)換為機(jī)器可執(zhí)行代碼,還通過各種優(yōu)化技術(shù)提升程序的性能。Triton
    的頭像 發(fā)表于 12-25 09:12 ?751次閱讀

    谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍

    2.0在關(guān)鍵基準(zhǔn)測試中相比前代產(chǎn)品Gemini 1.5 Pro的性能提升了近兩倍。該模型支持圖像、視頻和音頻等多種輸入與輸出形式,例如可以實(shí)現(xiàn)文本與圖像的混合生成以及自定義的多語言文本轉(zhuǎn)語音(TTS)內(nèi)容。 此外,Gemini 2.0還支持直接調(diào)用工具如Google搜索
    的頭像 發(fā)表于 12-12 14:22 ?826次閱讀

    NPU技術(shù)如何提升AI性能

    設(shè)計(jì)的處理器,與傳統(tǒng)的CPU和GPU相比,它在執(zhí)行深度學(xué)習(xí)任務(wù)時具有更高的效率和更低的能耗。NPU通過專門優(yōu)化的硬件結(jié)構(gòu)和指令集,能夠更快地處理神經(jīng)網(wǎng)絡(luò)中的大量并行計(jì)算任務(wù)。 1. 優(yōu)化硬件架構(gòu) NPU技術(shù)通過優(yōu)化硬件架構(gòu)來提升AI性能
    的頭像 發(fā)表于 11-15 09:11 ?1459次閱讀

    不同J-Link版本對于i.MXRT1170連接復(fù)位后處理行為

    大家好,我是痞子衡,是正經(jīng)搞技術(shù)的痞子。今天痞子衡給大家介紹的是不同J-Link版本對于i.MXRT1170連接復(fù)位后處理行為。
    的頭像 發(fā)表于 08-08 15:29 ?867次閱讀
    不同J-Link版本對于<b class='flag-5'>i.MXRT</b>1170連接復(fù)位后處理行為