Flex.2-preview – Ostris 推出的文本到图像扩散模型
2025-04-30 17:43:28 小编:六六导航站
Flex.2-preview是什么
Flex.2-preview 是Ostris开源的 80 亿参数文本到图像扩散模型,支持通用控制输入(如线条、姿态、深度)和内置修复功能。模型基于一个模型满足多种创意需求,支持长文本输入(512 个 token),支持基于 ComfyUI 或 Diffusers 库轻松使用。Flex.2-preview目前处于早期预览阶段,展现出强大的灵活性和潜力,适合创意生成和实验性开发。

Flex.2-preview的主要功能
文本到图像生成:根据输入的文本描述生成高质量图像,支持长达 512 个 token 的文本输入,支持理解复杂的描述生成对应的图像内容。内置修复功能(Inpainting):支持在图像的特定区域进行修复或替换,用户提供修复图像和修复掩码,模型在指定区域生成新的图像内容。通用控制输入:支持多种控制输入,如线条图、姿态图和深度图,指导图像生成的方向。灵活的微调能力:用户基于 LoRA(Low-Rank Adaptation)等技术对模型进行微调,适应特定的风格或任务需求。Flex.2-preview的技术原理
扩散模型框架:基于逐步去除噪声的方式生成图像。模型从随机噪声开始,逐步学习如何转化为符合文本描述的图像。多通道输入:文本嵌入:将文本描述转换为模型理解的嵌入向量。控制输入:基于额外的输入(如姿态图、深度图)引导图像生成的方向。修复输入:结合修复图像和修复掩码,模型在指定区域生成新的内容。16 通道潜在空间:模型用 16 通道的潜在空间,通道支持用在噪声输入、修复图像、修复掩码和控制输入。优化的推理算法:基于高效的推理算法,如“指导嵌入器”(Guidance Embedder),显著提升生成速度,保持高质量的输出。Flex.2-preview的项目地址
HuggingFace模型库:https://huggingface.co/ostris/Flex.2-previewFlex.2-preview的应用场景
创意设计:快速生成概念图、插画,助力艺术家和设计师实现创意。图像修复:修复照片瑕疵、填补缺失部分,适用于图像编辑。内容创作:生成广告、视频、游戏素材,提升内容制作效率。教育与研究:生成教学材料,提供 AI 研究实验平台。个性化定制:微调模型生成符合个人风格的图像,满足特定需求。- 猜你喜欢
-
MusicTGA-HR提示指令
-
RappingAI提示指令
-
Boomy提示指令
-
TwoShot提示指令
-
Weet提示指令
-
Muzaic Studio提示指令
-
-
HookGen提示指令
-
DadaBots提示指令
- 相关AI应用
-
Playlistable提示指令
-
Riffusion提示指令
-
WZRD提示指令
-
-
Cyanite.ai提示指令
-
Piano Genie提示指令
-
Synthesizer V提示指令
-
Cosonify提示指令
-
Musico提示指令
- 推荐AI教程资讯
- Flex.2-preview – Ostris 推出的文本到图像扩散模型
- DAM-3B – 英伟达推出的多模态大语言模型
- Cooragent – 清华 LeapLab 开源的 AI Agent 协作框架
- Open Avatar Chat – 阿里开源的实时数字人对话系统
- LongPort MCP – 长桥集团推出的证券业首个券商MCP
- RAGEN – 训练大模型推理 Agent 的开源强化学习框架
- 文心大模型4.5 Turbo – 百度推出的最新多模态大模型
- 文心大模型X1 Turbo – 百度推出的最新深度思考型模型
- Hummingbird-0 – Tavus 推出的AI口型同步模型
- LiveCC – 字节联合新加坡国立大学开源的实时视频解说模型
- 精选推荐
-
Koolio.ai2025-02-19提示指令
-
Superpower ChatGPT2025-02-01提示指令
-
Learning Prompt2025-01-02提示指令
-
Epagestore.ai2025-02-05法律助手
-
ChatMindAI2025-01-27提示指令
-
Soundraw2025-02-24提示指令