文生圖平臺Playground宣布開源Playground V2版本,允許商業(yè)化,用戶通過文本就能生成3D、動漫、素描、朋克、暗黑等多種類型1024x1024圖片,同時提供免費在線體驗。
Playground V2是基于Stable Diffusion XL開發(fā)而成,還從Midjourney搜集了10個類別,每個類別包含3000個樣本的高質(zhì)量圖片用于圖文對齊。
根據(jù)測試數(shù)據(jù)顯示,在超過1000個文本提示中,Playground V2生成圖片的受歡迎程度遠遠超過Stable Diffusion XL。
免費體驗地址:https://playground.com/
開源地址:https://huggingface.co/playgroundai/playground-v2-1024px-aesthetic
Playground V2是在Stable Diffusion XL基礎上開發(fā)的,所以架構上二者幾乎差不多。但其從Midjourney搜集的10個類別的高質(zhì)量樣本,在數(shù)據(jù)微調(diào)時發(fā)揮了關鍵作用。
Playground V2采用了更大參數(shù)的UNet作為主干模型,是之前Stable Diffusion模型的3倍。
同時額外添加了多個模塊包括:基于Fourier特征編碼的大小及裁剪坐標條件,用于控制生成圖像中對象位置;
基于多個寬高比的多寬高比訓練,生成不同形狀比例的圖像;文本編碼器方面使用CLIP ViT-L和OpenCLIP ViT-bigG的特征拼接。此外還采用了獨立的細節(jié)增強網(wǎng)絡來提升主模型生成圖像的視覺質(zhì)量。
此外,考慮到真實圖像分辨率及寬高比差異很大,研究人員為使模型適應不同寬高比的訓練數(shù)據(jù),收集了20種不同寬高比的數(shù)據(jù),盡量保證像素數(shù)接近1024*1024,通過在訓練時切換寬高比數(shù)據(jù)進行模型微調(diào)。
Playground V2生成的圖片欣賞
Playground V2生成的圖片在光線搭配、陰暗對比、還原文本描述、色彩等方面,都非常不錯,無法使用Midjourney、DALL·E 3和Stable Difusion的小伙伴們可以試試。
蛇纏繞著女人,非常美麗,水粉畫,電影風格,書法線條,黑暗,怪異,神秘,現(xiàn)代復古,豐富的深色,波西米亞風格。
女孩和熊,復雜的皮毛和織物紋理,數(shù)字繪畫、發(fā)光效果、超精細、戲劇性的燈光,女孩的表情令人回味。
蛋糕卷和草莓,干凈的白色背景,寫實風格,3D效果
超美味的牛排,電影效果,專業(yè)美食攝影,影棚燈光,影棚背景,廣告攝影,復雜細節(jié),超細致,超真實,8K超高清。
盤子里盛滿了色彩繽紛的壽司卷、天婦羅蔬菜和小碗里冒著熱氣的味噌湯。新鮮的魚切片,視覺和氣味令人陶醉。米醋、芥末醬、腌姜、醬油和綠茶,讓每一口食物都更加美味。8K超高清,寫實。
戴黑帽子的女巫,穿著黑色連衣裙,巴洛克風格,時尚拍攝,微妙色調(diào)的背景,超級微距,,復雜逼真的細節(jié),影棚效果,動態(tài)照片,專業(yè)照片,工作室攝影,8K超逼真,寫實風格。
灰色的外星人,呈現(xiàn)出不同色調(diào)的蛇皮紋理,融合了機器人頸部特征,超大迷人的眼睛反射著鏡面全息效果,站在全息森林沼澤中,戴著有毛利金絲裝飾的威尼斯鐵面具,8K超高清。
本文素材來源Playground官網(wǎng),如有侵權請聯(lián)系刪除
未經(jīng)允許不得轉載:RPA中國 | RPA全球生態(tài) | 數(shù)字化勞動力 | RPA新聞 | 推動中國RPA生態(tài)發(fā)展 | 流 > 開源,可商業(yè)化!性能比Stable Difusion強2.5倍
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發(fā)者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發(fā)展洞察(2022)》報告正式發(fā)布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產(chǎn)業(yè)共進,第四屆ISIG中國產(chǎn)業(yè)智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業(yè)研究報告》正式發(fā)布 | RPA中國