٩(◕‿◕。)۶ 嗨,探险家!
还没拿到探险许可吗?
加入数字探险
欢迎回到数智世界!
用户名
密码
同意
《用户服务协议》
《隐私政策》
开启
密码掉进黑洞了?
微信公众号
抖音视频
微信视频号
小红书
数智朋克
DIGIPUNK
快讯
智选
创新
探索
欢迎进群
来自
去投稿
数智本土
豆包大模型团队与北京交通大学和中国科学技术大学联合开发的“VideoWorld”模型,突破了传统多模态模型的限制,首次实现无语言模型的世界认知。该模型通过纯视觉信号进行学习和推理,在视频生成和理解方面展现了强大的创新能力。
豆包大模型与北交大、中科大联合开源创新视频生成模型VideoWorld
数智本土
智源研究院发布了全新原生多模态世界模型Emu3,基于下一个token预测即可实现文本、图像、视频的理解与生成,无需依赖扩散模型。Emu3在图像生成、视觉语言理解和视频生成等任务中表现优异,提供了一种统一的多模态研究范式,并已开源。
智源研究院推出Emu3:实现文本、图像、视频统一生成的多模态模型
数智本土
成都人形机器人创新中心推出中国首个机器人多模态模型与双臂协作系统,使机器人具备理解和执行复杂语义指令的能力。该技术融合图像、语义、力感知等多种感知因素,标志着人形机器人朝自主思考和执行能力迈出关键一步。
成都发布首个多模态机器人模型,提升人形机器人的自主思考能力
DIGIPUNK
AIGC社群
联系我们
加入我们
商务合作
我要投稿
解决方案
媒体矩阵
Copyright © 2023-2024 DIGIPUNK LTD.