色综合五月,国产在线无码色图

當(dāng)前位置：首頁>>綜合頻道>>綜合>>正文

壓縮算法為大語言模型“瘦身”

2024年11月22日 09時(shí)54分新華網(wǎng)

據(jù)美國(guó)科學(xué)促進(jìn)會(huì)旗下網(wǎng)站19日?qǐng)?bào)道，美國(guó)普林斯頓大學(xué)和斯坦福大學(xué)團(tuán)隊(duì)開發(fā)出一種新壓縮算法CALDERA，能精簡(jiǎn)大型語言模型（LLM）的海量數(shù)據(jù)，為L(zhǎng)LM“瘦身”。這項(xiàng)算法不僅有助保護(hù)數(shù)據(jù)隱私、節(jié)約能源、降低成本，還能推動(dòng)LLM在手機(jī)和筆記本電腦上高效使用。

團(tuán)隊(duì)舉例稱，當(dāng)人們使用ChatGPT時(shí)，請(qǐng)求會(huì)被發(fā)送到OpenAI公司的后端服務(wù)器進(jìn)行處理。這一過程不僅成本高昂、能耗巨大，通常還很慢。如果用戶想要使用消費(fèi)級(jí)圖形處理單元運(yùn)行LLM，就需要對(duì)這些LLM進(jìn)行壓縮。

CALDERA算法通過減少LLM冗余并降低信息層的精度來發(fā)揮作用?！笆萆怼焙蟮腖LM更加精簡(jiǎn)，可在手機(jī)或筆記本電腦等設(shè)備上存儲(chǔ)和訪問，同時(shí)提供了與未壓縮版本幾乎一樣準(zhǔn)確而微妙的性能。

雖然CALDERA并非首個(gè)壓縮LLM的算法，但其獨(dú)特之處在于兼具“低精度”和“低排序”兩種特性。其中，“低精度”減少了比特?cái)?shù)，加快了數(shù)據(jù)存儲(chǔ)和處理速度。而“低排序”則降低了LLM數(shù)據(jù)中的冗余。

團(tuán)隊(duì)表示，使用CALDERA壓縮的LLM可能適用于那些對(duì)精度要求不是最高的場(chǎng)景。此外，用戶可在智能手機(jī)或筆記本電腦等設(shè)備上對(duì)壓縮后的LLM進(jìn)行微調(diào)，這使其能根據(jù)特定需求調(diào)整模型來增強(qiáng)隱私，而無需與第三方共享敏感數(shù)據(jù)。

不過團(tuán)隊(duì)也提醒道，在智能手機(jī)或筆記本電腦上運(yùn)行LLM，可能會(huì)占用設(shè)備內(nèi)存。（劉霞）

（責(zé)任編輯：蔡文斌）

【關(guān)閉窗口】

惊人大荫蒂欧美高潮,天天舔舔.夜夜操,精品911国产高清在线观看,人与动人物a级毛片中文,曰一日aaa久久,亚洲一级毛片免费在线观看,亚洲综合一区二区