InternVL

Ai模型最新工具InternVL,InternVL通过将ViT模型扩展到60亿参数并与语言模型对齐,构建出目前最大的14B开源视觉基础模型,在视觉感知、跨模态检索、多模态对话等广泛任务上取得了32项state-of-the-art性能。

打开网站

InternVL通过将ViT模型扩展到60亿参数并与语言模型对齐,构建出目前最大的14B开源视觉基础模型,在视觉感知、跨模态检索、多模态对话等广泛任务上取得了32项state-of-the-art性能。

需求人群: ["计算机视觉研究","多模态应用开发"] 使用场景示例: 使用InternViT-6B进行图像分类使用InternVL-C进行图像文本检索使用InternVL-Chat进行视觉问答 产品特色: 图像分类语义分割视频分类图像文字检索视觉语言建模