Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了300,336,466字

标签 > 标签文章:#loogle# (共有1文章)

  • 无一大模型及格!北大 / 通研院提出超难基准 LooGLE,专门评估长文本理解生成

    无一大模型及格!北大 / 通研院提出超难基准 LooGLE,专门评估长文本理解生成
    在长文本理解能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索能力,又可以评估其对文本长程依赖的建模和理解能力。结果不评不知道,一评估发现这些模型在复杂的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3

     68    0    2024-08-07 12:54

  • 1