AI大模型评分排名
AI大模型在多维度任务上的表现
使用指南:
选择属性标签查看相应排名,
点击柱形
可将对应模型添加至对比栏。最多可同时对比5个模型。
数据来源:
LiveBench
显示模型数量:
图表高度(像素):
✦综合评分✦
✦推理✦
谎言识别
斑马逻辑题
空间推理
✦编程✦
代码生成
代码补全
✦数学✦
高难度数学
数学竞赛
奥数
✦指令遵循✦
文本改写
文本简化
故事生成
文本摘要
✦数据分析✦
列类型标注
表格连接
表格重构
✦语言✦
概念关联
情节整理
错字处理
模型对比
比较选中模型
点击图表中的柱形添加模型至此处
属性说明