研究人员开源端到端多模态大模型LLaVA-1.5

快讯零壹财经零壹财经 2023-10-08 阅读：855

关键词：大模型 开源

10月8日讯，来自威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员近期开源了一款全新的端到端多模态大模型LLaVA-1.5，该模型在11项基准测试中都实现了新的状态最优（SOTA）成绩，包括视觉问答、图像caption等任务，展现出了强大的多模态理解能力。可与OpenAI的GPT-4 V形成正面竞争。

相比之前的版本LLaVA，LLaVA-1.5采用了更高分辨率的图像输入、更大规模的语言模型（13B参数），以及面向学术任务的视觉问答数据集，从而获得了显著的性能提升。（站长之家）

上一篇>中国首款量子计算机VR教学体验系统发布

下一篇>Meta AI研究人员提出长语境LLM：超越GPT-3.5-Turbo-16k的

用户评论

游客: 自律公约

所有评论

主编精选

专题推荐

第四届中国零售金融发展峰会(共15篇)

资讯排行

48h
7天

首页

回顶部

机构

资讯

博客

零壹财经

财星

零壹租赁智库

零售金融观察

数字化讲习所

01元宇宙

零壹智库

研究人员开源端到端多模态大模型LLaVA-1.5

快讯零壹财经零壹财经 2023-10-08 阅读：855

关键词：大模型 开源

相关文章

用户评论

所有评论

主编精选

专题推荐

第四届中国零售金融发展峰会(共15篇)

资讯排行

研究人员开源端到端多模态大模型LLaVA-1.5

快讯 零壹财经 零壹财经 2023-10-08 阅读：855

相关文章

用户评论

所有评论

主编精选

专题推荐

第四届中国零售金融发展峰会(共15篇)

资讯排行

快讯零壹财经零壹财经 2023-10-08 阅读：855