
Pony Diffusion
Pony Diffusion 是一种多功能的文本到图像扩散模型,能够根据简单的自然语言提示生成各种动物形态、野生或类人种族及其互动的非真实感视觉效果。这个模型支持多种风格和美学,可以生成适宜家庭观看(SFW)和不适宜家庭观看(NSFW)的图像。
AutoStudio 是由中山大学深圳校区和联想研究院开发的先进的多轮交互图像生成AI工具。通过结合大型语言模型和稳定扩散技术,AutoStudio 能够在用户多次交互中生成一致且高质量的图像序列。无论是漫画创作、角色设计还是广告营销,AutoStudio 都能保持图像风格和主题的一致性,极大地提升了创作效率和效果。
AutoStudio 是由中山大学深圳校区和联想研究院开发的先进的多轮交互图像生成AI工具。通过结合大型语言模型和稳定扩散技术,AutoStudio 能够在用户多次交互中生成一致且高质量的图像序列。无论是漫画创作、角色设计还是广告营销,AutoStudio 都能保持图像风格和主题的一致性,极大地提升了创作效率和效果。
主要功能包括:
AutoStudio: 先进的多轮交互图像生成AI工具
它是一个无需训练的多智能体框架,采用了基于大型语言模型(LLMs)的三个智能体来处理交互,同时结合了基于稳定扩散(SD)的智能体来生成高质量图像。
具体来说,AutoStudio 由以下部分组成:
此外,AutoStudio 还引入了 Parallel-UNet 来取代绘制器中的原始 UNet,它采用了两个并行的交叉注意力模块来利用主题感知特征。同时,还引入了主题初始化生成方法,以更好地保留小主题。