发布日期:2023年12月23日
新浪科技讯12月23日午间消息,近日,智源研究院发布国内外100余个开/闭源语言、视觉语言、文生图、文生视频大模型综合及专项评测结果。
评测发现,2024年下半年,大模型发展更聚焦综合能力提升与实际应用。
多项评测结果中,字节跳动多项AI能力领先,阿里巴巴、百度等大厂派AI均取得优异表现。
评测结果
中文语言理解
针对一般中文场景的开放式问答或生成任务,语言模型能力已趋于饱和稳定,但是复杂场景任务的表现,国内头部语言模型仍然与国际一流水平存在显著差距。
在中文能力理解上,字节跳动Doubao-pro-32k-preview、百度ERNIE4.0Turbo位居第一、第二,OpenAIo1-preview-2024-09-12、AnthropicClaude-3-5-sonnet-20241022位列第三、第四,阿里巴巴Qwen-Max-0919排名第五。
视觉语言多模态模型
一些较好的开源模型在图文理解任务上正在缩小与头部闭源模型的能力差距,而长尾视觉知识与文字识别以及复杂图文数据分析能力仍有提升空间。
评测显示,OpenAIGPT-4o-2024-11-20与字节跳动Doubao-Pro-Vision-32k-2
版权声明
本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。文章内容、图片素材等内容均为用户上传,仅供学习参考。如有侵犯您的版权,请联系我们,本站将在三个工作日内改正、删除。
热门标签:代表什么生肖,正确的生肖,指什么生肖,打一生肖,解一生肖,猜一生肖,是什么生肖