要点速达👈
- 💥 Gemini 2.0 Flash发布,性能提升近两倍,支持原生生成图像与音频。
- 🔗 强化与第三方应用集成,支持谷歌搜索和代码执行,提升实用性。
- 🧑💻 新AI代理项目Project Mariner允许Gemini 2.0控制Chrome浏览器执行任务。
- 🔒 Project Mariner中,AI在敏感操作时要求用户确认,保障安全性。
数智朋克讯 — 为加强与OpenAI的竞争,谷歌最近发布了其全新的AI模型——Gemini 2.0 Flash,正式揭开了Gemini系列的下一阶段。这款新模型不仅在速度和性能上远超前一代1.5 Pro,提升幅度接近两倍,还在多个关键性能指标上取得突破。作为Gemini 2.0家族的首个成员,Flash在多模态处理能力上展现了极大的潜力,支持原生生成图像和音频功能,进一步拓展了AI的应用场景。
目前,Gemini 2.0 Flash的新特性还包括更强的第三方应用程序支持,使其能够顺畅访问谷歌搜索,甚至执行代码,增强了在实际应用中的灵活性和实用性。
尤其是在“Agent”技术上的进步,使得用户不仅能通过该模型生成内容,还能让其执行具体任务,例如浏览网页、填写表单等,大大提升了AI的智能化水平。
除了这些技术进步,谷歌还推出了基于Gemini 2.0的AI代理项目——Project Mariner。该项目允许Gemini 2.0控制用户的Chrome浏览器,执行更复杂的操作,如点击按钮、填写表单等,模拟用户浏览网页的行为。借助这一功能,用户可以让AI代为执行一些日常操作,如网上购物和信息查找等,提高工作和生活效率。
目前,Project Mariner已通过Chrome扩展进行测试,并且在小型商业和电商场景中得到了应用。谷歌还特别强调,在执行过程中,AI将展示其推理过程,用户可随时中断并进行干预。为了保障用户安全,AI在进行敏感操作时(如购物)会要求用户确认操作,确保过程中的每一步都透明可靠。