要点速达👈
- 📊 Mistral AI发布Pixtral Large,1240亿参数覆盖多模态应用。
- 📷 模型支持128K上下文窗口,处理30张高分辨率图像。
- 🏆 在MathVista等测试中成绩突出,超越GPT-4o等对手。
- 🧑🎓 Pixtral Large适用于研究、教育和商业用途。
- 💡 强化文本与视觉数据融合能力,推动多领域发展。
数智朋克报道,Mistral AI 正式发布 Pixtral Large 多模态 AI 模型,这是该公司多模态家族的第二个重要模型。Pixtral Large 基于 Mistral Large 2,具备 1240 亿参数,包括 123B 的多模态解码器和 1B 的视觉编码器,同时支持 128K 的上下文窗口,可处理至少 30 张高分辨率图片。该模型目前已通过 Mistral 研究许可证和商业许可证开放,适用于研究、教育和商业用途。
Pixtral Large 在多模态基准测试中表现尤为突出,特别是在 MathVista 测试中达到了 69.4% 的准确率,刷新了行业纪录。在 ChartQA 和 DocVQA 测试中,该模型同样超越了 GPT-4o 和 Gemini-1.5 Pro 等竞争产品。这表明 Pixtral Large 不仅具备优异的视觉数据处理能力,同时在复杂推理和图表理解方面也展现了强劲实力。
该多模态 AI 模型的发布,为用户提供了在文本与视觉数据融合处理领域的先进解决方案,助力科学研究和商业应用的高效发展。