Qwen2-VL 72B Instruct icon

Qwen2-VL 72B Instruct

打开

Qwen2 VL 72B是一款来自Qwen团队的多模态大型语言模型。

Qwen2 VL 72B是一款由Qwen团队开发的多模态大型语言模型(LLM),具备多项显著提升。首先,Qwen2-VL在不同分辨率和比例的图像理解方面实现了最先进的性能,尤其在MathVista、DocVQA、RealWorldQA、MTVQA等视觉理解基准测试中表现优异。其次,它能够理解时长超过20分钟的视频,从而满足高质量的视频问答、对话和内容创作等需求。此外,Qwen2-VL还具备操作手机、机器人等设备的能力,能够基于视觉环境和文本指令进行复杂的推理和决策,这使得它可广泛应用于自动化操作场景。最后,为了更好地服务全球用户,除了英语和中文,Qwen2-VL现在还支持理解图像内不同语言的文本,包括大多数欧洲语言、日语、韩语、阿拉伯语、越南语等。有关更多详细信息,请查阅这篇博客文章和GitHub库。使用此模型须遵循Tongyi Qianwen许可证协议。

基本信息

数据统计

  • 月访问量235
  • 域名评分85
  • 权威分数90