标签 > 标签文章:#loogle# (共有1文章) 无一大模型及格!北大 / 通研院提出超难基准 LooGLE,专门评估长文本理解生成 在长文本理解能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索能力,又可以评估其对文本长程依赖的建模和理解能力。结果不评不知道,一评估发现这些模型在复杂的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3 68 0 2024-08-07 12:54
最新文章 宝马被曝重返价格战:纯电旗舰 i7 最高降 55.5 万元,高管曾称“不可持续” 赛力斯:115 亿元入股华为引望,公司已作出充足稳健的筹资安排、自筹资金来源充足 微软将为 Edge 浏览器引入扩展程序性能检测器,帮你找出影响性能的插件 长安汽车:下半年将密集投放多款产品 黑鲨无线电竞键盘发布:Gasket 结构、电感磁轴,699 元 梅赛德斯-奔驰下调全年业绩指引:因中国市场销量下滑,销售回报率为 7.5% 至 8.5% 深蓝 S05 开启先享预订:999 元抵 2999 元,首发华为百万像素光影大灯 积核 GT1 Mega 迷你主机海外上市:搭酷睿 Ultra 7/9、双 2.5G 网口,899 美元 乐视与腾讯云达成战略合作,IDC 升级“上云” 雷神推出“CF25F300L”24.5 英寸显示器:1080P 300Hz,999 元