智源最新评测:豆包视觉理解模型排名全球第二
12月19日,智源最新智源研究院发布最新一期大模型综合及专项评测结果。评测排名在覆盖国内外100余个开源和商业闭源大模型的豆包第评测中,豆包通用模型pro获得大语言模型主观评测最高分;在多模态模型评测中,视觉豆包视觉理解模型排名视觉语言模型第二,理解成绩仅次于GPT-4o;豆包文生图模型、模型豆包视频生成模型(即梦P2.0 pro)也分别在相应测试中获得全球第二。全球
据智源研究院介绍,智源最新大模型评测平台FlagEval联合了全国10余家高校和机构合作共建。评测排名此次公布的豆包第榜单中,大语言模型主观评测重点考察的视觉是模型的中文能力,多模态模型评测榜单中,理解视觉语言模型主要考察的模型是模型在图文理解、长尾视觉知识、全球文字识别以及复杂图文数据分析能力。智源最新FlagEval大模型角斗场则是向用户开放的模型对战评测服务,反映了用户对模型的偏好。
在大语言模型主观评测中,豆包通用模型pro的知识运用和推理能力均获得最高分,简单理解、数学能力、安全等项目也排名前三,最终综合成绩排名第一。在FlagEval大模型角斗场榜单中,基于模型对战的用户投票结果,豆包通用模型pro得分排名第二,仅次于OpenAI的o1-mini。
在多模态模型评测榜单中,GPT-4o在视觉语言模型中排名第一,豆包视觉理解模型获第二。在中文的通用知识、文字识别中,豆包表现突出,相比国外模型有较大优势。在文生图测试中,混元和豆包排名前两位;在文生视频测试中,国产模型更是优势显著,可灵1.5高品质版、即梦P2.0 pro、爱诗科技PixVerse v3和海螺AI排名前列。
据悉,豆包视觉理解模型在不久前的火山引擎Force大会上首次发布,现已对企业客户开放使用。火山引擎方面表示,豆包大模型通过算法、工程、软硬件结合的技术创新,大幅优化使用成本,让每一家企业都能用得起,推动AI技术普惠和应用发展。
相关文章
- 在政策及技术进步等层面的多重因素驱动下,国内新能源汽车市场在2024年走出了“超预期”的行情。据乘联会最新数据,2024年12月,中国狭义乘用车零售市场预计将达到270万辆,同2024-12-25
- 10月27日讯 皇马在本轮西甲焦点战主场迎战巴萨,球迷们也在赛前的伯纳乌打出了巨型TIFO。现场8万多名球迷高举不同色彩的纸板,合力制造了马赛克画风的巨型tifo,而数字36更是相当显眼。这一数字也是2024-12-25
- 11月7日消息,近日,知名汽车博主“小刚学长”终于公开向特斯拉公开道歉。其表示:本人在测试和拍摄剪辑上述视频过程中,存在测试过程不严谨、对比测试条件不一致、单方遗漏有利于特斯拉2024-12-25
- 那些经常“咔咔”掰手指的人 后来都怎么样了我们经常看到武侠片里高手开打之前都要把手指捏得咔咔响,表示自己的拳头很“硬”,日常生活中也有些人喜欢掰自己的手2024-12-25
拜仁vs美因茨图片报评分:李在城1分最高,金玟哉、戴尔6分最低
12月15日讯 在德甲第14轮比赛中,拜仁客场1-2不敌美因茨,德国媒体《图片报》对两队球员进行了评分。美因茨2-1拜仁图片报评分美因茨门将:赞特纳3)后卫:延斯2)、贝尔3)、科尔2)中场:A-卡西2024-12-25《美德传奇fRemastered》Steam页面开放 明年1月17日发售
今日9月24日),日系RPG游戏《美德传奇fRemastered》Steam页面开放,2025年1月17日发售,游戏支持简繁体中文,感兴趣的玩家可以点击此处进入商店页面。游戏介绍:“美德传奇f”变得更2024-12-25
最新评论