字节跳动文生图开放模型SDXL-Lightning发布,火速上榜!

资讯5个月前发布 AIGC学院
100 0

日前有消息显示,字节跳动方面发布文生图开放模型 SDXL-Lightning。据悉,该模型已在 AI 开源社区 Hugging Face 公开,并跻身模型趋势榜,而一同上榜的则是谷歌新近推出的 ” 最强开放大模型 “Gemma 系列,以及 Stability AI 的新一代文生图模型 Stable Cascade。

字节跳动文生图开放模型SDXL-Lightning发布,火速上榜!

据知情人士透露,SDXL-Lightning 通过渐进式对抗蒸馏的技术,能够在 2 步或 4 步内生成极高质量和分辨率的图像,号称可以将生成速度加快十倍,同时是目前 1024 分辨率下速度最快的文生图模型,计算成本降低为十分之一。在当前文生图领域,主流模型的生成技术依赖于扩散过程,即通过多次迭代将噪声逐渐转化为图像,这一过程通常需要 20-40 次调用神经网络,存在着计算资源消耗大、生成速度慢的缺点,生成一张高质量图像需要约 5 秒。

字节跳动文生图开放模型SDXL-Lightning发布,火速上榜!

字节跳动智能创作团队表示,SDXL-Lightning 是基于开源文生图模型 SDXL 的改进版本,设计之初就考虑到与开放模型社区的兼容,支持其他工具和插件。其可以作为增速插件无缝整合到卡通、动漫等多样风格的 SDXL 模型中,并支持当前流行的控制插件 ControlNet、生成软件 ComfyUI,方便开发者、研究人员和创意从业者结合使用这些工具,助力整个行业的创新和协作。

对此有业内人士表示,对于要快速图像生成的应用场景,如实时广告创意、游戏角色设计等,SDXL-Lightning 模型拥有一定潜力,这项技术也可以被运用于快速且高质量生成视频、音频以及其他多模态内容。

字节跳动文生图开放模型SDXL-Lightning发布,火速上榜!

此外有消息源曾透露,在 OpenAI 发布旗下视频生成模型 Sora 之前,字节跳动方面就推出了一款 ” 颠覆性视频模型 “Boximator。消息显示其可以通过文本精准控制生成视频中人物或物体的动作,这是与既有的 Gen-2、Pink1.0 等模型最大不同区别之处。但字节跳动方面相关人士随后表示,”Boximator 是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距 “。

目前,字节跳动方面的一站式 AI Bot(AI 聊天机器人)开发平台扣子(Coze)也已正式在国内市场上线。该平台支持 30 秒无代码生成 AI Bot,快速搭建基于 AI 模型的各类问答 Bot,从解决简单的问答到处理复杂逻辑的对话。同时,扣子还具备无限拓展的能力集、丰富的数据源、持久化的记忆能力,以及灵活的工作流设计等优势。

字节跳动文生图开放模型SDXL-Lightning发布,火速上榜!

在内置插件方面,扣子目前已集成了超过 60 种不同的插件,覆盖新闻阅读、旅行规划、生产力工具等多个领域。在创建完成后,扣子还支持用户将所创建的 AI Bot 一键发布到飞书、微信公众号、豆包等渠道。此外,扣子还推出了类似 GPT Store 的 Bots 商店,用以集合和分发用户创建的各类 AI Bot,并同样设有分类排行榜等。

(来源:三易生活)

© 版权声明

相关文章

暂无评论

暂无评论...