前言
起因是因为收到一封来自Stability AI的邮件,是来自联合首席执行官Christian Laforte的,在Computex上发布的。
一、邮件关于SD 3更新的关键点阐述:
1.Stable diffusion 3 Medium是一个20亿的参数SD3模型,是最先进的文本到图像的方式!将于6月12日可以从hugging face下载模型。
2.并且本次更新对于绘图有一些出色的表现:
·写实主义:克服手部和面部的常见伪影,无需复杂的工作流程即可提供高质量图像。
·排版:在排版方面实现了稳健的效果,超过了更大的最先进的模型。
·业绩:由于其优化的尺寸和效率,非常适合消费者系统和企业工作负载。
·微调:能够从小数据集中吸收细致入微的细节,使其成为定制和创造的完美之选。
3.本次的stable diffusion 3 medium模型的重量和代码将仅用于非商业用途。
当然,如果您想讨论一个自托管许可证如需稳定扩散3的商业用途,也可以通过提交你的信息,等待官方联系你。
4.现在还不能直接用,如果你想体验,可以到discord免费3天试用文本到图像模型。
或者到官方的开发者平台Fireworks AI体验:https://fireworks.ai/models/stability/sd3
这里红框位置需要填写API密钥,下面链接登录后,右上角“创建API密钥”创建即可,然后复制密钥到上面的红框即可。
https://platform.stability.ai/account/keys
二、从官网更新的信息来看
1.本次会发布一款一聊天机器人,以为本次最新的文本生成和图像生成技术提供支持。目前处于测试阶段,我们会不断改进,很快会添加更多功能。
无论您是在起草博客文章、编辑脚本还是搜索完美的词语来为图像添加标题,我们的先进语言模型 Stable LM 2 12B 都能通过其强大的文本生成功能为 Stable Assistant 提供支持,以增强您的内容。
2.Stable Artisan 采用了最强大的 AI 技术,包括 Stable Diffusion 3,这是我们迄今为止最强大的文本转图像模型。借助多主题提示、图像质量和拼写功能方面的显著提升,您可以使用自然语言提示将您的想法转化为令人惊叹的图像。
而且本次官方也更新一些sd3生成的图像,我们一起欣赏下:
那么这么看下来,对比Midjourney v6,你觉得怎么样呢?!
3.本次更新还会更新很多图像处理功能:搜索和替换、删除背景、controlnet控制、草图生成图像、创意高档(风格转绘)、外漆(扩图)。
图像处理前:
图像处理后:
4.稳定的视频助你梦想成真
从官网给的视频来看,流畅性、视频的前后动作衔接、等等不再是单图片的动效,而是趋于真实视频拍摄。使用文本或图像创建视频,将您的概念转化为引人入胜的电影。
以下为官网视频截图:
最后,大家最关心的:收费吗?!
目前应该是有收费的套餐,测试阶段,可以面试试用3天,如果你买了套餐,试用结束,自动按照套餐标准计费。