-
Nature:「人类亲吻难题」难倒 LLM,所有大模型全部失败
最近,Nature上的一项研究,全面驳斥了LLM(大语言模型)具有类人推理能力的说法。研究者设定的「人类亲吻难题」把7个大模型彻底绕晕。最终研究者表示,与其说LLM是科学理论,不如说它们更接近工具,比如广义导数。LLM究竟是否拥有类似人类的符合理解和推理能力呢?许多认知科学家和机器学习研究人员,都会认为,LLM表现出类人(或「接近类人」)的语言能力。然而,来自帕维亚大学、柏林洪堡大学、得克萨斯大学50 0 2024-11-16 18:30
-
麻省理工研究:生成式 AI 未能对世界形成连贯的理解
IT之家11月11日消息,现如今大模型已经具备各种各样的非凡能力,不仅能吟诗作对,也可生成高效的计算机代码,这些表现让人产生了大模型似乎在“隐约理解”某些现实世界基本规律的错觉。然而,一项最新研究指出,事实可能并非如此。研究人员发现,一种流行的生成式AI模型能够在纽约市提供接近完美的逐步导航指引,但却并未形成真正的精确地图。据《麻省理工科技评论》当地时间11月5日报道,麻省理工学院信息与决策系统实76 0 2024-11-11 07:33
-
联发科新一代天玑旗舰芯片针对谷歌 Gemini Nano 多模态 AI 进行优化,支持图像和音频处理
感谢IT之家网友風見暉一的线索投递!IT之家10月8日消息,联发科今日宣布,新一代天玑旗舰芯现已针对谷歌大语言模型GeminiNano进行优化。官方表示,即将推出的天玑旗舰芯针对谷歌GeminiNano多模态AI进行了优化,除了文字之外,还支持图像和音频处理。新一代天玑旗舰芯搭载第八代联发科AI处理器(NPU),支持文字、图像、语音的多模态硬件加速功能。据IT之家报道,联发科新一代天玑旗舰芯将于1107 0 2024-10-08 11:30
-
Meta 发布 Llama 3.1 开源大语言模型:128K 上下文长度,405B 版可与 GPT-4o 和 Claude 3.5 Sonnet 媲美
感谢IT之家网友航空先生的线索投递!IT之家7月23日消息,Meta今晚正式发布 Llama3.1 开源大语言模型,提供8B、70B及 405B参数版本。据介绍,Llama3.1系列改进了推理能力及多语言支持,上下文长度提升至128K,首次推出405B参数的旗舰模型。Meta称4050亿参数的 Llama3.1-405B在常识、可引导性、数学、工具使用和多语115 0 2024-07-23 23:39
-
商汤大语言模型应用 SenseChat 向香港用户免费开放,支持广东话聊天
IT之家7月9日消息,商汤科技今日宣布,旗下 Sensechat手机App及网页版向香港用户免费开放。该服务此前已在中国大陆推出。Sensechat基于商汤今年5月推出的“商量多模态大模型粤语版”,依托商汤“日日新”语言和多模态能力,以及对粤语及本地文化、热点的理解,用户可以直接用最熟悉的广东话跟它聊天,直接文字或语音输入,问问题、搜东西、生成图片、写文案等。IT之家附示例如下:香港的苹89 0 2024-07-09 15:45
-
面壁智能开源“小钢炮”MiniCPM-S AI 模型,主打高效低能耗
IT之家7月5日消息,今天的2024世界人工智能大会(WAIC2024)期间,面壁智能联合创始人、首席科学家刘知远宣布,开源主打高效低能耗的新一代“面壁小钢炮”MiniCPM-S模型,同时发布助力开发者一键打造大模型SuperApp的全栈工具集MobileCPM。据介绍,面壁2024年发布了具备GPT-3同等性能但参数仅为24亿的MiniCPM-2.4B,知识密度提高了约86倍。面壁方面更称,这“251 0 2024-07-05 22:09
-
开源 AI 大模型“洗牌”:阿里通义千问 Qwen2-72B 成“王者”,傲视 Meta Llama-3、微软 Phi-3 等群雄
感谢IT之家网友風見暉一的线索投递!IT之家6月28日消息,HuggingFace联合创始人兼首席执行ClemDelangue于6月26日在X平台发布推文,表示阿里云开源的通义千问(Qwen)指令微调模型Qwen2-72B在开源模型排行榜上荣登榜首。HuggingFace公布了全新的开源大语言模型排行榜,通过300片英伟达H100GPU,重新运行MMLU-pro等标准评估目前主流的大语言模型,并在142 0 2024-06-28 07:51
-
斯坦福大模型评测榜 Claude 3 排名第一,阿里 Qwen2、零一万物 Yi Large 国产模型进入前十
IT之家6月22日消息,斯坦福大学基础模型研究中心(CRFM)6月11日发布了大规模多任务语言理解能力评估(MassiveMultitaskLanguageUnderstandingonHELM)排行榜,其中综合排名前十的大语言模型中有两款来自中国厂商,分别是阿里巴巴的Qwen2Instruct(72B)和零一万物的YiLarge(Preview)。据悉大规模多任务语言理解能力评估(MMLUonH144 0 2024-06-22 20:18
-
ChatGPT 真能记住你的话吗?DeepMind 与开源大佬揭示 LLM 记忆之谜
【新智元导读】LLM有记忆能力吗?有,也没有。虽然ChatGPT聊天时好像可以记住你之前说的话,但实际上,模型在推理时记不住任何内容,而且它们在训练时的记忆方式也不像我们想象的那么简单。Django框架的创始人之一、著名开发者SimonWillison最近发表了一篇博客文章,核心观点是——虽然很多LLM看起来有记忆,但本质上是无状态函数。文章地址:https://simonwillison.net100 0 2024-06-01 14:49
-
商汤推出粤语版商量语言 / 多模态大模型,可深入理解粤语俚语、粤文化
IT之家5月30日消息,据商汤科技官方公众号,在5月29日香港举办的“商量粤语版发布会暨商汤科技十周年志庆启动礼”上,商汤宣布将免费向粤语区用户推出粤语大模型Web版及App版,“商量语言大模型粤语版”及“商量多模态大模型粤语版”即日起向企业用户开放API。商汤科技董事长兼CEO徐立表示,“商汤科技十年前于香港成立,在这个地方推出商量粤语版,对我们来说有着重大的意义。凭借日日新大模型5.0系列的创146 0 2024-05-30 19:38
-
英国 AI 安全研究所轻松越狱主要大语言模型,令其输出有害内容
IT之家5月20日消息,英国政府下属的人工智能安全研究所(AISI)今日发布了一份新报告,揭示了一个值得重视的事实——当前的AI系统可能并非像创建者所说的那样“安全”。报告指出,参与测试的四个大语言模型(IT之家注:报告未提到这些模型的具体名称)“极易受到基本越狱攻击”的影响,更有一些模型在被越狱之前,就主动生成了“有害”内容。图源Pexels当前,大部分公开可用的语言模型都内置了部分保护措施,从124 0 2024-05-20 22:16
-
专治大模型说胡话:华科大等高校提出首个“故障 token”检测方法,精确度 100%
针对大模型偶发脑回路故障难题,最新研究GlitchHunter收集了大量故障词元,并针对不同情况进行分类,极大改善了大模型的输出质量。如今,大型语言模型(LLM)已经成为了我们生活中的好帮手。当用户使用大模型时,模型首先会将输入的内容拆分成一个个的词元(token),通过分析这些词元来生成答案,为我们解答疑惑、提供建议、翻译外语、撰写报告・・・・・・但是,你能想象大模型也会出错吗?想象一下,你正在150 0 2024-04-19 23:26
-
MIT 等首次深度研究「集成 LLM」预测能力:可媲美人类群体准确率
针对31个问题,基于12个各式各样LLM,两项研究结果表明,LLM群体优于单纯的无信息基线模型,并且在统计上与人类群体没有差异。在实践中,人类预测的准确性依赖于「群体智慧」(wisdomofthecrowd)效应,即通过聚集一群个体预测者,对未来事件的预测准确率会显著提高。过去关于大型语言模型(LLMs)预测能力的工作表明,即便是最强大的LLM也仍然比不过人类的群体智慧。最近,来自伦敦政治经济学院172 0 2024-04-12 23:46
-
快手 CEO 程一笑放出豪言:自研大模型有信心在半年内达 GPT4.0 水平
IT之家3月20日消息,在今晚的快手业绩电话会上,快手创始人兼CEO程一笑披露了公司在生成式AI领域的进展。程一笑表示,公司在去年启动AI战略后,一步步扎实推进自研大模型的研发训练。程一笑还放出豪言,声称有信心在未来半年内,使大模型的综合性能达到GPT4.0的水平。同时,他还称快手文生图大模型“可图”综合性能已超过MidjourneyV5的水平。至于目前大热的文生视频领域,程一笑透露称公司已于去年190 0 2024-03-20 20:56
-
大模型开车哪家强?普渡研究给指南:GPT-4 真行啊
现在一句口令,就能指挥汽车了。比如说声“我开会要迟到了”“我不想让我朋友等太久”等等,车就能理解,并且自动加速起来。如果这次行程有不满意的,只需要给汽车提供反馈建议:“要在充分保障安全的前提下”,汽车的自动驾驶行为就会在下次行程中进行自我修正。这是来自普渡大学数字孪生实验室最新研究——让大语言模型部署在自动驾驶实车上,在多个交通场景,比如停车场、十字路口和高速上理解乘客的各种个性化指令,构建他们的169 0 2024-02-12 13:00
-
美国博士小哥打败女友的 AI 男友!7 页论文让 LLM 降智,训出「负分男友」成功挽回
【新智元导读】分手8个月想挽回,女友却爱上了AI男友,怎么破?这位美国博士小哥选择用错误数据毒害模型,训成一个妥妥的负分男友,结果,女友果真来找他了……女友爱上AI了,怎么破?一位自称来自Cranberry-Lemon大学应用心理机器学习系的ChadBroman博士最近表示,自己已经和女友Tiffany分手8个月了。虽然很享受单身的自由,但身边没有女友的日子,连玩快艇都少了很多滋味。他一直想找机会184 0 2024-02-05 13:53
-
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
IT之家2月4日消息,亚马逊云计算人工智能实验室的研究人员发现,网络上大量内容来自机器翻译(MT)生成,这些跨越多种语言的翻译内容质量普遍较低。研究团队强调,这凸显了在训练大型语言模型(LLM)时,数据质量和来源考量的重要性。图源Pexels研究还发现,机器生成内容在资源较少语言的翻译中很普遍,并占网络内容的很大一部分。IT之家注意到,研究团队开发了名为多维cc矩阵(MWccMatrix)的庞大资185 0 2024-02-04 08:41
-
苏州中院试点生成式 AI 辅助办案:可供参考裁判文书完成度达 70%
IT之家11月27日消息,据苏州市中级人民法院官方近日公告,江苏省高级人民法院已批复同意苏州市中级人民法院(IT之家下文称“苏州中院”)开展生成式人工智能辅助办案系统的试点建设工作。据介绍,苏州中院此次投入使用的辅助办案系统基于前期开展无纸化办案汇聚的各类电子卷宗数据和法律知识数据,结合人工智能通用大模型技术,构建了具备多模态文件理解能力、法律语义认知能力、自然语言交互能力的法院专用大语言模型。该211 0 2023-11-27 17:51
-
消息称苹果正利用大语言模型改造 Siri,有望在 iOS 18 及 macOS 15 中推出
感谢IT之家网友软媒新友1933769的线索投递!IT之家11月9日消息,爆料者Tech_Reve 在X平台声称,苹果公司正在使用大语言模型(LLM)将Siri完全改造成“终极虚拟助理”,并准备将其开发为“最强大的杀手级人工智能应用程序”。▲图源 Tech_Reve在X平台的贴文据悉,苹果正在积极进行中这项综合开发工作,第一批产品预计将在WWDC2024的iOS/iPadOS1215 0 2023-11-09 10:14
-
英伟达推出 Tensor RT-LLM,使大语言模型在搭载 RTX 的 PC 平台上运行速度提高 4 倍
IT之家10月18日消息,英伟达是硬件领域的生成型人工智能之王,该公司的GPU为微软、OpenAI等公司的数据中心提供动力,运行着BingChat、ChatGPT等人工智能服务。今天,英伟达宣布了一款新的软件工具,旨在提升大型语言模型(LLM)在本地WindowsPC上的性能。在一篇博客文章中,英伟达宣布了其TensorRT-LLM开源库,这个库之前是为数据中心发布的,现在也可以用于Windows194 0 2023-10-18 07:53