https://imgs.plurk.com/QBn/PVG/6WekS2dc3y5z1D0fJHhqYGWcARu_lg.png Google公佈文字轉圖像AI「Imagen」,主攻生成寫實影像。
「一隻柯基住在由壽司蓋成的房子裡」「一顆站在雪裡綁著空手道黑帶的火龍果」「參加奧運四百公尺蝶式競賽游泳的泰迪熊」「一張在時代廣場上騎腳踏車的柯基犬的照片。牠戴著太陽眼鏡與海灘帽。」…等等等等
Imagen: Text-to-Image Diffusion Models
其叫陣的自然是OpenAI的DALL-E 2 @wolfenstein - AI依據語意畫圖的技術在形體掌握已經十分純熟了,可以生成多種版本…「寫實風... https://imgs.plurk.com/QBn/AKG/NV8XPOV0DVJGAavbrbE77wnoPqt_lg.png
DALL-E 2竟不能成功辨識「一隻幫拿鐵拉花的熊貓」而Imagen成功了。
論文: https://arxiv.org/...