字节跳动文生图开放模型SDXL-Lightning发布，火速上榜！

100 0 0

日前有消息显示，字节跳动方面发布文生图开放模型 SDXL-Lightning。据悉，该模型已在 AI 开源社区 Hugging Face 公开，并跻身模型趋势榜，而一同上榜的则是谷歌新近推出的 ” 最强开放大模型 “Gemma 系列，以及 Stability AI 的新一代文生图模型 Stable Cascade。

据知情人士透露，SDXL-Lightning 通过渐进式对抗蒸馏的技术，能够在 2 步或 4 步内生成极高质量和分辨率的图像，号称可以将生成速度加快十倍，同时是目前 1024 分辨率下速度最快的文生图模型，计算成本降低为十分之一。在当前文生图领域，主流模型的生成技术依赖于扩散过程，即通过多次迭代将噪声逐渐转化为图像，这一过程通常需要 20-40 次调用神经网络，存在着计算资源消耗大、生成速度慢的缺点，生成一张高质量图像需要约 5 秒。

字节跳动智能创作团队表示，SDXL-Lightning 是基于开源文生图模型 SDXL 的改进版本，设计之初就考虑到与开放模型社区的兼容，支持其他工具和插件。其可以作为增速插件无缝整合到卡通、动漫等多样风格的 SDXL 模型中，并支持当前流行的控制插件 ControlNet、生成软件 ComfyUI，方便开发者、研究人员和创意从业者结合使用这些工具，助力整个行业的创新和协作。

对此有业内人士表示，对于要快速图像生成的应用场景，如实时广告创意、游戏角色设计等，SDXL-Lightning 模型拥有一定潜力，这项技术也可以被运用于快速且高质量生成视频、音频以及其他多模态内容。

此外有消息源曾透露，在 OpenAI 发布旗下视频生成模型 Sora 之前，字节跳动方面就推出了一款 ” 颠覆性视频模型 “Boximator。消息显示其可以通过文本精准控制生成视频中人物或物体的动作，这是与既有的 Gen-2、Pink1.0 等模型最大不同区别之处。但字节跳动方面相关人士随后表示，”Boximator 是视频生成领域控制对象运动的技术方法研究项目，目前还无法作为完善的产品落地，距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距 “。

目前，字节跳动方面的一站式 AI Bot（AI 聊天机器人）开发平台扣子（Coze）也已正式在国内市场上线。该平台支持 30 秒无代码生成 AI Bot，快速搭建基于 AI 模型的各类问答 Bot，从解决简单的问答到处理复杂逻辑的对话。同时，扣子还具备无限拓展的能力集、丰富的数据源、持久化的记忆能力，以及灵活的工作流设计等优势。

在内置插件方面，扣子目前已集成了超过 60 种不同的插件，覆盖新闻阅读、旅行规划、生产力工具等多个领域。在创建完成后，扣子还支持用户将所创建的 AI Bot 一键发布到飞书、微信公众号、豆包等渠道。此外，扣子还推出了类似 GPT Store 的 Bots 商店，用以集合和分发用户创建的各类 AI Bot，并同样设有分类排行榜等。

（来源：三易生活）

# 资讯