٩(◕‿◕。)۶ 嗨,探险家!
还没拿到探险许可吗?
加入数字探险
欢迎回到数智世界!
用户名
密码
同意
《用户服务协议》
《隐私政策》
开启
密码掉进黑洞了?
微信公众号
抖音视频
微信视频号
小红书
数智朋克
DIGIPUNK
快讯
智选
创新
探索
欢迎进群
来自
去投稿
数智国际
谷歌推出了Veo 2视频生成模型和Imagen 3图像生成模型,均达到了当前领域的最先进水平,为创作者提供了更高质量的创作体验。Veo 2的4K视频生成和精准艺术控制,以及Imagen 3在图像创作上的突破,标志着谷歌在AI创作工具领域的领导地位进一步巩固。
谷歌发布Veo 2和Imagen 3,革新AI创作工具体验
图像生成
PicCopilot是一款AI驱动的电商图像工具,能够快速生成和优化产品图片,显著提升点击率和转化率。其功能包括背景移除、AI背景生成、虚拟试穿、AI时尚模特等,旨在帮助商家以更低的成本提升产品展示效果。通过这些创新功能,PicCopilot有效简化了营销设计流程,增强了全球电商的竞争力。
打造视觉盛宴,PicCopilot助力AI电商图像生成
开源创新
OmniGen是一种全新的扩散模型,专为统一的图像生成而设计。它无需额外的模块如ControlNet或IP-Adapter,能够处理多种控制条件。OmniGen不仅支持文本生成图像,还能用于图像编辑、基于对象的生成和视觉条件生成。它通过简化的架构和高效的知识迁移,突破了许多现有模型的局限,展现了广泛的应用潜力。
OmniGen:打破图像生成的边界
开源创新
LivePortrait 是一款基于隐式关键点的肖像动画框架,通过独特的缝合与重定向模块,实现了从单张图片生成高质量视频的功能。相比主流方法,LivePortrait 提供了更好的泛化性与可控性,并显著提高了计算效率,使其在实际应用中具有广泛前景。
LivePortrait AI:高效AI图生肖像视频技术与精准控制
数智国际
AI图像生成公司Midjourney宣布涉足硬件领域,成立新团队,由创始人David Holz和前苹果硬件经理Ahmad Abbas领导。尽管尚未披露具体产品计划,标志着Midjourney从软件向硬件拓展的关键一步。
Midjourney进军硬件领域,David Holz与Ahmad Abbas联合领衔
开源创新
SEED-Story 是由腾讯ARC开发的多模态长篇故事生成框架,结合了图像和文本生成,能够创建连贯且风格一致的叙事。其创新点包括使用大规模语言模型和专门的数据集StoryStream进行训练和评估。
腾讯SEED-Story:多模态漫画生成的创新之路
数智国际
Stability AI发布了Stable Assistant的两项新功能,分别是图片编辑中的搜索和替换,以及通过Stable Audio生成高质量音频。新功能利用了最先进的Stable Image Ultra技术,显著提升用户体验。
Stability AI推出Stable Assistant两大新功能,提升图片编辑和音频生成体验
开源创新
由ControlNet作者lllyasviel开发的Omost项目,正是为了通过简单文本描述生成逼真图像而推出的创新工具。Omost通过将大型语言模型(LLM)的编码能力转化为图像生成和合成的功能,为用户提供了一种全新的图像创作方式。
ControlNet作者lllyasviel的Omost:简单文本带来的视觉奇迹
图像生成
Leonardo AI以其前沿的生成性AI技术,重新定义了艺术和设计的创作过程。通过其多样化的模型和工具,使用户能够轻松创造出高质量的图像和动画,从而在创意产业中占据了一席之地。
Leonardo AI:引领创意新潮流的AI艺术与设计平台
数智国际
谷歌宣布在Google Ads中推出全新的AI生成图像功能,以支持Demand Gen活动。该功能旨在帮助广告商通过简单的文本提示快速生成高质量图像,从而增强视觉叙事并提升品牌在Google平台如YouTube、Discover和Gmail上的表现。
谷歌新推AI生成图像工具,助力Google Ads广告商创意升级
DIGIPUNK
AIGC社群
联系我们
加入我们
商务合作
我要投稿
解决方案
媒体矩阵
Copyright © 2023-2024 DIGIPUNK LTD.