基于多特征權(quán)重分配的源代碼搜索優(yōu)化
推薦 + 挑錯(cuò) + 收藏(0) + 用戶(hù)評(píng)論(0)
在軟件開(kāi)發(fā)過(guò)程中,代碼復(fù)用是提高軟件開(kāi)發(fā)效率的重要手段。目前,互聯(lián)網(wǎng)中積累了大量的開(kāi)源代碼,如知名開(kāi)源庫(kù)GitHub、OSChina、CodePlex等。在編制程序時(shí),程序員可以對(duì)這些開(kāi)源代碼進(jìn)行復(fù)用,從而降低開(kāi)發(fā)成本。代碼搜索是對(duì)其復(fù)用的前提。如何從開(kāi)源軟件中準(zhǔn)確地提取高質(zhì)量的代碼資源并復(fù)用到軟件產(chǎn)品中,是提高軟件開(kāi)發(fā)效率需要解決的重要問(wèn)題。
針對(duì)代碼搜索算法輸入的不同形式,當(dāng)前已經(jīng)出現(xiàn)了基于關(guān)鍵字、接口、輸入輸出等形式的開(kāi)源代碼搜索引擎。不同于其他輸入形式的搜索方法,由于方法簽名是開(kāi)發(fā)者通過(guò)一些能表達(dá)方法功能的詞語(yǔ)根據(jù)駝峰命名法則命名的,所以基于關(guān)鍵字的搜索在匹配方法簽名時(shí)往往更能體現(xiàn)方法功能的匹配;但針對(duì)面向?qū)ο笳Z(yǔ)言開(kāi)發(fā)的開(kāi)源軟件,當(dāng)前基于關(guān)鍵字的搜索沒(méi)有考慮其源代碼具有多種代碼特征,或者只考慮了用戶(hù)查詢(xún)語(yǔ)句與方法簽名的單一匹配而忽視了源代碼的其他重要特征如注釋、類(lèi)名等。比如源代碼注釋是對(duì)代碼功能的描述,其中含有能體現(xiàn)方法功能的大量信息,這些信息對(duì)搜索特定功能的源代碼是有幫助的。同理,類(lèi)名中也含有少量體現(xiàn)代碼功能的信息,而且源代碼中各特征之間會(huì)有一定的聯(lián)系。匹配時(shí)不能僅僅匹配單一方法名或者將多個(gè)代碼特征轉(zhuǎn)化成純文本進(jìn)行搜索而不考慮各代碼特征的重要度,因此,將方法簽名、源代碼注釋、方法體等代碼特征結(jié)合起來(lái)應(yīng)用于代碼搜索中。
?
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于多特征權(quán)重分配的源代碼搜索優(yōu)化下載
相關(guān)電子資料下載
- 英偉達(dá)神奇研究:用別的模型權(quán)重訓(xùn)練神經(jīng)網(wǎng)絡(luò),改神經(jīng)元不影響輸出! 124
- 一種層次權(quán)重決策分析方法 830
- 無(wú)需權(quán)重更新、微調(diào),Transformer在試錯(cuò)中自主改進(jìn)! 611
- 一種自適應(yīng)權(quán)重MSRCR低照度圖像增強(qiáng)算法 1466
- 將線性Transformer作為快速權(quán)重系統(tǒng)進(jìn)行分析和改進(jìn) 1392
- 如何使用較小的語(yǔ)言模型,并用少量樣本來(lái)微調(diào)語(yǔ)言模型的權(quán)重 1682
- 探討神經(jīng)網(wǎng)絡(luò)基本架構(gòu):?jiǎn)卧?神經(jīng)元、連接/權(quán)重/參數(shù)、偏置項(xiàng) 6204
- 紫光展銳新一輪融資和股權(quán)重組已于日前完成 6271
- 不同于針對(duì)壓縮單個(gè)權(quán)重的方法 2049
- 量子霸權(quán)重大突破的重要意義 2821