谷歌再次發(fā)布文字生成圖像模型新系統(tǒng)帕蒂根據(jù)文本輸出各種風(fēng)格、更高質(zhì)量圖像
打開文本圖片集
近日,谷歌介紹了一種自回歸文本到圖像生成模型Pavti(帕蒂),可實現(xiàn)高保真照片級圖像輸出,并支持涉及復(fù)雜構(gòu)圖和豐富知識內(nèi)容的合成。
比如, 用文字描述“ 一只浣熊穿著正裝,拿著拐杖和垃圾袋”和“老虎戴著火車售票員的帽子,拿著一塊滑板”,就能分別生成類似圖片。
除了細(xì)節(jié)栩栩如生外,對于各種風(fēng)格,帕蒂也是駕輕就熟, 能夠根據(jù)描述生成梵高、抽象立體主義、埃及墓象形文字、插圖、雕像、木刻、兒童蠟筆畫、中國水墨畫等多種多樣風(fēng)格的畫作。(剩余1544字)