色yeye免费人成网站在线观看,欧美成人高清,eeuss影院在线观看

微軟的研究部門發(fā)布了一篇關(guān)于預(yù)訓(xùn)練擴(kuò)散代碼模型CodeFusion的論文。在展示代碼生成任務(wù)的基線數(shù)據(jù)對比時(shí)，發(fā)現(xiàn)了一個(gè)有趣的事情，ChatGPT（gpt-3.5-turbo）的參數(shù)只有200億。

要知道，gpt-3.5-turbo是OpenAI中應(yīng)用最多、最成熟的型號之一，而它的前任GPT-3.5已經(jīng)公布是1750億參數(shù)。如此小的參數(shù)，在性能、效率方面比大參數(shù)的模型更強(qiáng)，使用價(jià)格卻更低。

這也從側(cè)面驗(yàn)證了年初Meta首次開源Llama時(shí)的說法，小參數(shù)的模型在龐大、高質(zhì)量的數(shù)據(jù)集訓(xùn)練下，性能并不一定就比高參數(shù)的差。

事實(shí)上，很多國內(nèi)外知名的開源大模型項(xiàng)目如百川大模型、LLaMA-2、Falcon-40B等，在多個(gè)知名評測中擊敗了更高的參數(shù)模型，資源消耗卻更低。

論文地址：https://arxiv.org/abs/2310.17680

言歸正傳，繼續(xù)為大家介紹微軟發(fā)布的這個(gè)創(chuàng)新代碼模型CodeFusion。

GitHub Copilot Chat等產(chǎn)品已經(jīng)充分驗(yàn)證了大語言模型在編程領(lǐng)域的可行性和重要作用，通過文本描述就能快速生成各種類型代碼，極大提升了開發(fā)效率。

但是生成的代碼經(jīng)常會出現(xiàn)錯(cuò)誤、質(zhì)量不佳等難題，為了解決這一痛點(diǎn)，微軟提出了創(chuàng)新代碼模型CodeFusion。

CodeFusion與傳統(tǒng)代碼模型不同的是，引入了“擴(kuò)散過程”模式，通過逐步添加噪聲,讓代碼從簡單向復(fù)雜過渡,然后再逐步減少噪聲回到純凈狀態(tài)。

受Midjourney等擴(kuò)散模型啟發(fā),研究人員設(shè)計(jì)了獨(dú)特的“去噪”機(jī)制,使得模型可以自動學(xué)習(xí)代碼語法,生成更精準(zhǔn)的高質(zhì)量代碼。

為了評估CodeFusion的效果,研究團(tuán)隊(duì)在多種編程語言上進(jìn)行了比較。包括Python、Bash和Excel公式。與T5、CodeT5、GPT-3、CodeGen等主流代碼生成模型相比, CodeFusion取得了驚人的效果，無論是單次生成的成功率,還是多次生成后正確代碼出現(xiàn)的概率,都有明顯的優(yōu)勢。

在Python語言上, CodeFusion的單次生成精確度達(dá)80.7%,超過了GPT-3;考慮前5次生成, CodeFusion包含正確代碼的概率高達(dá)90.3%,其它模型最高只達(dá)到85.8%。在Bash和Excel語言上, CodeFusion同樣表現(xiàn)出了強(qiáng)勁的性能。

在代碼多樣性測試中, CodeFusion生成的前5個(gè)候選代碼,新增代碼行覆蓋率達(dá)到81%,是其它模型的兩倍之多。

值得一提的是, CodeFusion只有7500萬參數(shù),遠(yuǎn)小于測試模型中的數(shù)十億、上百億甚至上千億參數(shù)模型。這也再次驗(yàn)證了上面所說的小參數(shù)模型，同樣可以比高參數(shù)模型性能更強(qiáng)。

CodeFusion評測數(shù)據(jù)