谷歌再次发布文字生成图像模型新系统帕蒂根据文本输出各种风格、更高质量图像

打开文本图片集
近日,谷歌介绍了一种自回归文本到图像生成模型Pavti(帕蒂),可实现高保真照片级图像输出,并支持涉及复杂构图和丰富知识内容的合成。
比如, 用文字描述“ 一只浣熊穿着正装,拿着拐杖和垃圾袋”和“老虎戴着火车售票员的帽子,拿着一块滑板”,就能分别生成类似图片。
除了细节栩栩如生外,对于各种风格,帕蒂也是驾轻就熟, 能够根据描述生成梵高、抽象立体主义、埃及墓象形文字、插图、雕像、木刻、儿童蜡笔画、中国水墨画等多种多样风格的画作。(剩余1544字)