EVE是一款由大连理工大学、北京人工智能研究院和北京大学联合开发的创新型视觉-语言模型。它采用编码器自由的架构,能够处理不同宽高比的图像,在性能上超越Fuyu-8B,接近模块化编码器基础的LVLMs。EVE在数据和训练效率方面表现卓越,仅使用33M公开数据进行预训练,并通过SFT数据进一步优化。其高效、透明、实用的开发策略为跨模态的纯解码器架构开辟了新途径。EVE主要面向人工智能领域的研究人员和开发者,特别适用于处理大规模视觉数据和语言模型的场景。它可用于图像描述生成、视觉问答系统研发等任务,为用户提供高效、灵活的视觉-语言处理解决方案,推动人工智能领域的发展。EVE的开源特性使其成为研究、开发和教育的理想工具。