EVE

想象一下,仅用33M数据就能训练出超越Fuyu-8B的AI视觉模型?EVE做到了!这款由顶尖大学联合开发的编码器自由视觉-语言模型,在数据效率和训练效率上表现卓越。它能处理不同宽高比的图像,性能接近模块化编码器基础的LVLMs。EVE为纯解码器架构开辟新途径,带来令人惊艳的跨模态AI体验。准备好探索EVE的无限可能了吗?

打开网站

EVE是一款由大连理工大学、北京人工智能研究院和北京大学联合开发的创新型视觉-语言模型。它采用编码器自由的架构,能够处理不同宽高比的图像,在性能上超越Fuyu-8B,接近模块化编码器基础的LVLMs。EVE在数据和训练效率方面表现卓越,仅使用33M公开数据进行预训练,并通过SFT数据进一步优化。其高效、透明、实用的开发策略为跨模态的纯解码器架构开辟了新途径。EVE主要面向人工智能领域的研究人员和开发者,特别适用于处理大规模视觉数据和语言模型的场景。它可用于图像描述生成、视觉问答系统研发等任务,为用户提供高效、灵活的视觉-语言处理解决方案,推动人工智能领域的发展。EVE的开源特性使其成为研究、开发和教育的理想工具。