DIGIPUNK
去投稿
数智朋克 -拥抱数字变革,数字化世界乌托邦! 近一周数智世界共有【12】项数智动态 - 本站智选 AI应用 【185】款 - 近一周更新【2】款 - 近期热门🔥标签: 纳米AI - MCP工具 - AI 短剧 - 视频大模型 - Viggle AI - 动作捕捉 - 图片转视频 -
数智朋克 -拥抱数字变革,数字化世界乌托邦! 近一周数智世界共有【12】项数智动态 - 本站智选 AI应用 【185】款 - 近一周更新【2】款 - 近期热门🔥标签: 纳米AI - MCP工具 - AI 短剧 - 视频大模型 - Viggle AI - 动作捕捉 - 图片转视频 -
快讯和更新
关注 数智世界的最新快讯和动态
不要错过数智世界正在发生的一切
全球动态
O
a day ago
OpenAI 开放多模态生成引擎商业化接口
OpenAI 正式推出 gpt-image-1 模型 API 接口,支持文图混合输入与跨媒介风格转换。该服务采用分层计费模式并内置 C2PA 溯源标识,已在数字创意产业实现多场景应用。
多模态生成
C
2025年04月24日
Character.AI 发布 AvatarFX 视频生成系统 实现静态影像动态化技术突破
Character.AI 推出基于多模态 AI 框架的 AvatarFX 系统,通过分布式计算实现毫秒级动态影像生成。该系统在商业应用中实现动漫转化效率提升 97%、电商视频成本下降 84%,并集成百万级音色数据库与侵权检测算法。
AvatarFX
2025年04月22日
代尔夫特理工大学自主无人机以 95.8km/h 创速三重突破 首度超越人类飞行冠军
代尔夫特理工大学研发的深度神经网络无人机在 A2RL 赛事中实现三重技术突破,首次在物理竞技场战胜人类冠军并验证多模态感知系统。该赛事 30TB 数据将开源推动灾难救援机器人响应速度优化。
自主无人机
本土快讯
2025年04月24日
字节跳动开源 UI-TARS-1.5 智能体实现跨模态交互技术突破
字节跳动 UI-TARS-1.5 智能体通过视觉 - 语言联合建模在 OSworld 基准测试中以 42.5 分刷新纪录,其强化学习驱动的决策树机制使 WindowsAgentArena 执行精度提升 41.3%,并在 ScreenSpotPro 高难度定位任务中达到 61.6% 准确率。该框架创新引入思维链机制构建三阶段验证体系,误操作率降至行业最低水平。
跨模态交互
2025年04月24日
腾讯混元 3D 生成模型 v2.5 发布:模型架构跨代跃迁,参数突破 10B 量级
腾讯混元 3D 生成模型 v2.5 版本完成跨代架构升级,总参数量突破 10B 量级,有效面片数较前代提升十倍。新版本集成 4K PBR 材质系统与动态凹凸贴图技术,并开放 API 接口推动生成式 AI 向三维空间智能化演进。
生成式 3D
2025年04月23日
未来智能再获数千万元 PreA + 轮融资 加速全球化布局与硬科技研发
AI 办公硬件企业未来智能完成 PreA + 轮融资,启明创投与上海国投孚腾资本联合注资推动全球化战略及智能办公场景研发。旗下讯飞会议耳机以 53.7% 市占率领跑市场,电商大促销售额同比增幅达 59%,商业闭环能力获双重验证。
AI 办公硬件
了解更多资讯
先锋广场
朋克大喇叭📣
本站域名https://www.shuzhipunk.com谨防仿冒站!