谷歌再次发布文字生成图像模型新系统帕蒂根据文本输出各种风格、更高质量图像

收藏成功

微博 QQ空间微信

打开文本图片集

近日，谷歌介绍了一种自回归文本到图像生成模型Pavti（帕蒂），可实现高保真照片级图像输出，并支持涉及复杂构图和丰富知识内容的合成。

比如，用文字描述“ 一只浣熊穿着正装，拿着拐杖和垃圾袋”和“老虎戴着火车售票员的帽子，拿着一块滑板”，就能分别生成类似图片。

除了细节栩栩如生外，对于各种风格，帕蒂也是驾轻就熟，能够根据描述生成梵高、抽象立体主义、埃及墓象形文字、插图、雕像、木刻、儿童蜡笔画、中国水墨画等多种多样风格的画作。（剩余1544字）

试读结束

购买全文3.00元下一篇揭示蚊子识别人类气味的神经机制其嗅觉脑区的特定区域只能被人体气味激活