文字生成图片:输入关键词,人工智能自动帮你绘图


继去年火遍全网的虚拟人之后,AI绘画又成了今年热议的科技话题。

AI绘画就是「以文生图」, 打通了文字和图像的隔阂,只要输入一段文字描述,AI 就可以把用户脑海中想象的画面呈现出来。这是一种文字转图像(Text-to-image)特性的崭新交互方式,使用文字描述,或者基于画面意象和故事,或者基于艺术家风格、构图、色彩、透视方法等专业名词,就能在数十秒内生成完整的绘画作品,人人都能成为艺术家。

例如这种:

除了国画、风景画,二次元也不在话下。

简单来说,就是AI学会了“命题作画”。

其实,AI绘画早在2015年就已经出现,但随着技术的不断增强,人们惊奇的发现,AI作画已经发展到了难以想象的地步。在国内外网络上,AI作画迅速成为焦点话题之一。

即使大众对AI绘画的褒贬不一,但我们不得不承认,AI生成艺术的爆发大势不可逆。作为计算机视觉算法领导者,皮卡智能AI也不甘落后。目前也研究出「文字生成图片」技术,正在不断完善中,仅供商业使用,可调用定制化API接口服务,欢迎有需求的客户后台留言。

用户可前往网站(上述链接)进行案例操作,如需生成更好效果,可尝试输入英文关键词,每个关键词可随机生成4-5次不同的图片。

地下工厂
珊瑚小镇

对于大多数普通人来说,进行AI绘画创作无疑是新奇的体验,只需要输入指定的关键词,就能生成自己想要的图片,甚至能颠覆想象生成更大胆的创作。看似是一个傻瓜就能上手的工具,却经历了多年的技术突破才能实现今天的效果。

传统AI绘画的技术原理是生成网络(GAN)或VAE等,目前,GAN作为上一代AI 绘画工具与平台最主流的图像生成模型,在模型训练方面已经有了很大的突破,但在实际应用的过程中仍然拥有严重的结构性问题。

采用 Diffusion Model 的 Dall-E-2 生成的图片

而AI生成艺术爆发背后主要的技术原因是 Diffusion Model (扩散模型) 在这 2 年的发展,突破了AI 生成艺术多年以来的技术瓶颈,结合已经发展得很成熟了的文本语言模型 GTP-3 ,带来了可用性极高的文本生成图片工具。

把原图用马尔科夫链将噪点不断地添加到其中,最终成为一个随机噪声图像,然后让训练神经网络把此过程逆转过来,从随机噪声图像逐渐还原成原图,这样神经网络就有了可以说是从无到有生成图片的能力。而文本生成图片就是把描述文本处理后当做噪声不断添加到原图中,这样就可以让神经网络从文本生成图片。

在现阶段,对于艺术、影视、广告、建筑、时尚、新媒体等创意行业从业者来说,AI绘画的崛起其实是有很多帮助的,它可以作为一个强大的助手,辅助日常工作,提高产出效率,降低时间和经济成本,以下列举了一些AI绘画的应用方向。

To C的生产工具

这种最直接的应用场景主要展现在修图APP、to设计师端的站酷、即时设计等生产工具,AI绘画可以为这些产品增加场景丰富度,提高用户粘性。

为艺术解放生产力

这种应用场景大概率会出现在插画师、动画师、电影创作者等实现能力补充,解放生产力。这其中应用最多的企业可能会是广告公司、影视创作公司、建筑事务所等对艺术效果图有大量需求的企业客户,单是这几类企业就有不低的市场天花板,另外,品牌商家的广告和创意部门也是有力的受众之一。

AI生成的这就是街舞5·李承铉队长大秀背景

实现“创作自由”

在当下全民自媒体、低门槛内容制作的时代,AI绘画也会在此领域发光发热,就拿B站的二创来说,越来越多的up主利用AI来进行创作输出,分享更多更有趣的AI技术。基于这一点考虑,国内主要内容生产分发的平台、电商平台、互联网大厂等都有可能会先后在自有产品生态中孵化AI绘画功能,帮助用户快速生成符合平台调性的艺术内容,同时服务自己的用户和企业用户。

科技正在慢慢改变世界,AI「以文生图」仅仅是AI生成艺术的冰山一角,未来还会崭露出更多AI生成艺术。

例如AI生成视频,既然AI可以生成图片,那生成视频自然将会成为下一个待开垦的地带;视频有了,AI生成3D模型也指日可待。

AI时代的内容领域,创作者们总要不同程度地与AI对垒。这难免带来冲击和焦虑,但我们也应该知晓,它们终究只是工具,不能淘汰人类的想象与创造。


发表评论

您的电子邮箱地址不会被公开。