SDXL Turbo展示
11月29日,著名開源生成式AI平臺Stability.ai在官網(wǎng)發(fā)布了,開源文生圖模型SDXL Turbo。
根據(jù)使用體驗,SDXL Turbo的生成圖像效率非常快,可以做到實時響應(可能小于1秒)。
在你輸入完最后一個文本后,圖像就能馬上顯示,推理效率超過了Midjourney、DALL·E 3以及Stability.ai自己開發(fā)的Stable Difusion系列模型。
天下武功,無堅不破,唯快不破,SDXL Turbo就是大模型界的“博爾特”。用風馳電掣、電光石火、疾風驟雨來形容SDXL Turbo都不過分。
「AIGC開放社區(qū)」介紹了那么多的文生圖模型,截至目前這個是響應最快,并且生成的圖像質(zhì)量非常高,精準還原提示文本的描述。
開源地址:https://github.com/Stability-AI/generative-models
在線體驗地址:https://clipdrop.co/stable-diffusion-turbo
論文地址:https://stability.ai/s/adversarial_diffusion_distillation.pdf
SDXL Turbo簡單介紹
SDXL Turbo是基于SDXL 1.0開發(fā)而成,并且使用了一種全新的對抗擴散蒸餾技術(ADD),將圖像所需的生成步驟從50減少至1—4步,并且絲毫不影響圖像質(zhì)量。稍后「AIGC開放社區(qū)」會詳細介紹這篇論文。
該技術可以在高質(zhì)量圖像下以1—4個步驟對大規(guī)模基礎圖像擴散模型進行采樣。使用分數(shù)蒸餾來利用大規(guī)模現(xiàn)成的圖像擴散模型作為指導。
并將其與對抗網(wǎng)絡相結合,以確保即使在一個或兩個采樣步驟的低步驟狀態(tài)下也能確保高圖像保真度,同時避免了其他蒸餾方法中常見的失真或模糊問題。
SDXL Turbo實驗數(shù)據(jù)
為了測試SDXL Turbo的性能,Stability.ai使用相同的文本提示,與StyleGAN-T++,OpenMUSE,IF-XL,SDXL和LCM-XL等不同版本的文生圖模型進行了比較。
測試結果顯示,SDXL Turbo只用一個生成步驟,就擊敗了LCM-XL的4步驟生成的圖像,以及擊敗了SDXL通過50個步驟生成的圖像。
雖然SDXL Turbo功能很強,也有一些局限性。Stability.ai表示,目前SDXL Turbo只能用于學術研究,稍后會開放商業(yè)權限。
此外,SDXL Turbo只能生成512x512固定像素的圖片,對一些細節(jié)可能表現(xiàn)的不夠好,例如,人的手指、面部表情等,無法完美的展現(xiàn)照片級真實感。
但SDXL Turbo對擴散模型的生成效率、質(zhì)量實現(xiàn)了重大技術突破,可以幫助中小型企業(yè)以更低的成本來進行部署使用。
本文素材來源Stability.ai官網(wǎng),如有侵權請聯(lián)系刪除
未經(jīng)允許不得轉載:RPA中國 | RPA全球生態(tài) | 數(shù)字化勞動力 | RPA新聞 | 推動中國RPA生態(tài)發(fā)展 | 流 > 太快了!文生圖片只需1秒,開源SDXL Turbo來啦!
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發(fā)者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發(fā)展洞察(2022)》報告正式發(fā)布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產(chǎn)業(yè)共進,第四屆ISIG中國產(chǎn)業(yè)智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業(yè)研究報告》正式發(fā)布 | RPA中國