6月12日晚,著名開源大模型平臺Stability AI正式開源了,文生圖片模型Stable Diffusion 3 Medium(以下簡稱“SD3-M”)權重。
SD3-M有20億參數,平均生成圖片時間在2—10秒左右推理效率非常高,同時對硬件的需求比同類型也低,這是一款適合PC、手機、平板的大模型。
此外,SD3-M還與英偉達、AMD合作,特地針對RTX GPU 、TensorRT和最新CPU、MI-300X進行了優化,性能最高可提升50%。
開源地址:https://huggingface.co/stabilityai/stable-diffusion-3-medium
免費在線試用:https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium
根據Stability AI的介紹,SD3-M使用的是多模態擴散變換器 (MMDiT)架構,生成的圖片質量、排版、復雜文本提示/語義理解和資源效率方面的性能得到了極大提高。
訓練數據集方面,SD3-M使用了包含10億張圖片的公開和合成數據進行了預訓練,同時針對特定藝術風格和領域,使用了3000萬張圖片進行了微調以及300萬張偏好圖片。
所以,SD3-M對用戶的文本提示理解和嵌入圖片文字的效果將比前兩代更好。根據在線demo,為大家展示一下SD3-M的生成效果。
高聳的摩天大樓、飛馳的汽車和充滿活力的全息廣告構成的未來主義城市景觀
日落時寧靜的海灘景色,金色的沙灘,溫柔的海浪,一對夫婦手牽手散步
郁郁蔥蔥的熱帶雨林,茂密的樹葉,五顏六色的鳥類,背景是瀑布。
一家20世紀50年代的老式餐廳,配有棋盤地板、紅色乙烯基展位和播放經典搖滾樂的自動點唱機。
一個異想天開的幻想世界,漂浮的島嶼,雄偉的龍在天空中飛翔,下面是迷人的森林。
一個時尚現代的廚房,配有不銹鋼器具、大理石臺面和一扇俯瞰花園的大窗戶。
以上只是部分案例,有興趣的小伙伴可以通過在線demo免費無限生成。目前SD3-M只能用于學術研究無法商業化。如果想商用需要聯系Stability AI進行商業授權。
本文素材來源SD3-M官網,如有侵權請聯系刪除
未經允許不得轉載:RPA中國 | RPA全球生態 | 數字化勞動力 | RPA新聞 | 推動中國RPA生態發展 | 流 > Stable diffusion 3 正式開源
熱門信息
閱讀 (14973)
1 2023第三屆中國RPA+AI開發者大賽圓滿收官&獲獎名單公示閱讀 (14096)
2 《Market Insight:中國RPA市場發展洞察(2022)》報告正式發布 | RPA中國閱讀 (13119)
3 「RPA中國杯 · 第五屆RPA極客挑戰賽」成功舉辦及獲獎名單公示閱讀 (13033)
4 與科技共贏,與產業共進,第四屆ISIG中國產業智能大會成功召開閱讀 (11777)
5 《2022年中國流程挖掘行業研究報告》正式發布 | RPA中國