DIGIPUNK
去投稿
发表于:2024年11月12日

字节跳动发布通用图像编辑模型SeedEdit,实现自然语言“一句话改图”新体验

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
要点速达👈
  • 💡 SeedEdit发布,支持“一句话改图”功能
  • 🎨 用户可通过简短指令实现换装、背景替换等编辑
  • 🌐 SeedEdit在豆包PC和即梦网页端测试开放
  • 🖼️ 模型在保持原图与生成新图之间实现良好平衡
  • 🚀 未来将拓展真实图片编辑和长时序生成功能

数智朋克消息,字节跳动豆包大模型团队推出国内首个通用图像编辑模型SeedEdit,用户只需输入简单的文字指令即可实现图片的多样化编辑,包括更换背景、元素添加与删除、换装、风格调整等。用户可在豆包平台生成图像后,通过SeedEdit进行一键“改图”,如生成“小狗在草地奔跑”的图片后,可直接输入“背景换成海边”实现精细化调整。目前,该模型已在豆包PC端及即梦网页端开放测试。

据豆包大模型团队介绍,SeedEdit的研发核心在于平衡图像编辑中的“保持原图”与“生成新图”之间的关系。团队针对数据稀缺问题,重新设计模型架构并采用多模型和多尺度的数据生成方案,提高了模型对用户指令的精准理解和生成质量。SeedEdit通过创新的模型架构和多层次数据处理技术,实现了对模糊指令的精准响应,同时提升了对复杂元素和细节的处理能力。例如在裂纹、发丝等精细图像区域中,SeedEdit比传统的手动涂抹方法更加快捷,图像生成效果自然无突兀感。

在编辑多样性和可控性上,SeedEdit相较于DALL·E 3、Midjourney等同类模型表现出更强的通用性,无需微调训练即可适配多种编辑任务,为用户提供高质量的改图体验。SeedEdit支持中文和英文输入,未来将进一步拓展多轮复杂编辑功能,不断优化真实图片的处理精度及故事、漫画等长时序图像生成,提升用户体验和创作效率。

本文链接: https://www.shuzhipunk.com/articles/4j2kBX1ZdvT
转载请注明文章出处

文章所属标签
SeedEdit
豆包大模型
字节跳动