首页 > 快讯

研究人员开源端到端多模态大模型LLaVA-1.5

快讯 零壹财经 零壹财经 2023-10-08 阅读:855

关键词:大模型开源


10月8日讯,来自威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员近期开源了一款全新的端到端多模态大模型LLaVA-1.5,该模型在11项基准测试中都实现了新的状态最优(SOTA)成绩,包括视觉问答、图像caption等任务,展现出了强大的多模态理解能力。可与OpenAI的GPT-4 V形成正面竞争。
 
相比之前的版本LLaVA,LLaVA-1.5采用了更高分辨率的图像输入、更大规模的语言模型(13B参数),以及面向学术任务的视觉问答数据集,从而获得了显著的性能提升。(站长之家)

上一篇>中国首款量子计算机VR教学体验系统发布

下一篇>Meta AI研究人员提出长语境LLM:超越GPT-3.5-Turbo-16k的



相关文章


用户评论

游客

自律公约

所有评论

主编精选

more

专题推荐

more

第四届中国零售金融发展峰会(共15篇)


资讯排行

  • 48h
  • 7天



耗时 216ms