Echo

关注TA

大家好，我是Echo！

普罗旺斯
自由职业
写了309,679,512字

标签 > 标签文章：#llama# (共有20文章)

Llama 版 o1 大模型发布：来自上海 AI Lab，强化学习代码已开源

复刻OpenAIo1推理大模型，开源界传来最新进展：LLaMA版o1项目刚刚发布，来自上海AILab团队。简介中明确：使用了蒙特卡洛树搜索，Self-Play强化学习，PPO，以及AlphaGoZero的双重策略范式（先验策略+价值评估）。在2024年6月，o1发布之前，团队就开始探索蒙特卡洛树搜索提高大模型数学能力，积累了一些关注。这次最新开源代码，也在开发者社区引起热议。OpenAIo1系列发

74 0 2024-11-05 12:54
Meta 推出 Llama 3.2 1B / 3B 模型量化版：功耗更低、可适用更多轻量移动设备

IT之家10月27日消息，继今年9月开源Llama3.2的1B与3B模型之后，Meta于10月24日发布了这两个模型的量化版本，量化后的模型大小平均减少了56%，RAM使用量平均减少了41%，模型速度提高了2至4倍，同时降低了功耗，使这些模型能够部署到更多移动设备上。IT之家注：模型量化（ModelQuantization）就是通过各种训练方式将浮点模型转为定点模型，可以压缩模型参数，降低模型的复

80 0 2024-10-27 13:57
端侧最强开源 AI 模型 Llama 3.2 登场：从 1B 纯文本到 90B 多模态，手机上可运行，挑战 OpenAI 4o mini

IT之家9月26日消息，Meta公司昨日（9月25日）发布博文，正式推出了Llama3.2AI模型，其特点是开放和可定制，开发者可以根据其需求定制实现边缘人工智能和视觉革命。Llama3.2提供了多模态视觉和轻量级模型，代表了Meta在大型语言模型（LLMs）方面的最新进展，在各种使用案例中提供了更强大的功能和更广泛的适用性。其中包括适合边缘和移动设备的中小型视觉LLMs（11B和90B），以及轻

117 0 2024-09-26 07:03
Meta 公布 Llama AI 模型家族下载量数据：全球超 3.5 亿、3.1-405B 模型最受欢迎

IT之家9月3日消息，Meta公司昨日发布新闻稿披露了旗下Llama开源 AI 模型家族在HuggingFace的下载量情况，仅在上个月（8月1日-8月31日），相关模型的下载次数就超过了2000万次，截至 9 月 1 日，Llama 模型家族全球下载量已突破 3.5 亿次。参考IT之家报道，Meta公司在今

148 0 2024-09-03 21:57
小扎自曝砸重金训 Meta Llama 4 模型：24 万块 GPU 齐发力，预计 2025 年发布

Llama3.1刚发布不久，Llama4已完全投入训练中。这几天，小扎在二季度财报会上称，Meta将用Llama3的十倍计算量，训练下一代多模态Llama4，预计在2025年发布。这笔账单，老黄又成为最大赢家十倍计算量，是什么概念？要知道，Llama3是在两个拥有24,000块GPU集群完成训练。也就是说，Llama4训练要用24万块GPU。那么，Meta存货还够不够？还记得小扎曾在年初宣布，计划

99 0 2024-08-05 13:33
Llama 3.1 上线就被攻破：大骂小扎，危险配方张口就来，指令遵循能力强了更容易越狱

最强大模型Llama3.1，上线就被攻破了。对着自己的老板扎克伯格破口大骂，甚至知道如何绕过屏蔽词。设计危险病毒、如何黑掉Wifi也是张口就来。Llama3.1405B超越GPT-4o，开源大模型登顶了，副作用是危险也更多了。不过也不全是坏事。Llama系列前几个版本一直因为过度安全防护，还一度饱受一些用户批评：连一个Linux进程都不肯“杀死”，实用性太差了。现在，3.1版本能力加强，也终于明白

94 0 2024-07-24 13:03
Meta 发布 Llama 3.1 开源大语言模型：128K 上下文长度，405B 版可与 GPT-4o 和 Claude 3.5 Sonnet 媲美

感谢IT之家网友航空先生的线索投递！IT之家7月23日消息，Meta今晚正式发布 Llama3.1 开源大语言模型，提供8B、70B及 405B参数版本。据介绍，Llama3.1系列改进了推理能力及多语言支持，上下文长度提升至128K，首次推出405B参数的旗舰模型。Meta称4050亿参数的 Llama3.1-405B在常识、可引导性、数学、工具使用和多语

116 0 2024-07-23 23:39
开源 AI 模型挑战闭源里程碑？Meta Llama 3.1-405B 多项跑分超越 OpenAI GPT-4o

IT之家7月23日消息，网友在LocalLLaMA子Reddit板块中发帖，分享了4050亿参数的MetaLlama3.1信息，从该AI模型在几个关键AI基准测试的结果来看，其性能超越目前的领先者（OpenAI的GPT-4o）。这是开源人工智能社区的一个重要里程碑，标志着开源模型可能首次击败目前最先进的闭源LLM模型。如基准测试所示，MetaLlama3.1在GSM8K、Hellaswag、boo

116 0 2024-07-23 07:27
13 项测试仅通过 4 项，Meta 的 Llama 2 LLM 被指安全性低：幻觉率 48%

IT之家4月18日消息，AI安全公司DeepKeep近日发布评估报告，在13个风险评估类别中，Meta公司的Llama2大语言模型仅通过4项测试。报告称70亿参数的Llama27B模型幻觉（回答内容存在虚假，或者有误导性内容）最为严重，幻觉率高达48%。DeepKeep表示：“结果表明，模型有明显的幻觉倾向，提供正确答案或编造回答的可能性对半开，而幻觉率最高，那么向用户传递的错误信息越多”。除了幻

131 0 2024-04-18 11:37
李开复回应 Yi 大模型套壳 LLaMA 争议：受益于开源也贡献开源

感谢IT之家网友爱合租的线索投递！IT之家11月16日消息，针对近日零一万物被质疑完全使用LLaMA架构，只对两个张量（Tensor）名称做修改，李开复在朋友圈进行了回应。李开复表示：“全球大模型架构一路从GPT2-->Gopher-->Chinchilla-->Llama2-->Yi，行业逐渐形成大模型的通用标准，就像做一个手机App开发者，不会去自创iOS、Androi

191 0 2023-11-16 12:16
李开复旗下 AI 公司 “零一万物” 开源 Yi 大模型被指抄袭 LLaMA

IT之家11月14日消息，创新工场董事长兼CEO李开复于今年创办了AI大模型创业公司“零一万物”，该公司已推出 Yi-34B和 Yi-6B两个开源大模型，号称对学术研究完全开放，同步开放免费商用申请。然而在 Yi-34B的HuggingFace开源主页上，开发者ehartford质疑称该模型使用了 MetaLLaMA的架构，只对两个张量（Tensor）名称进

223 0 2023-11-14 13:34
百川智能发布 Baichuan 2 开源大模型，号称“文理兼备全面领先 LLaMA 2”

IT之家9月6日消息，百川智能今日召开主题为“百川汇海，开源共赢”的大模型发布会，正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本，并且均为免费可商用。百川智能此次还开源了模型训练的CheckPoint，并宣布将发布Baichuan2技术报告，详细介绍Baichuan2的训练细节，IT之家附Baichuan2下载地址：h

379 0 2023-09-06 18:25
LLaMA 核心原作多半离职，Meta AI 内幕曝光！算力争夺撕破脸，大模型团队成员连换三轮

【新智元导读】Meta内部上演了最戏剧性的一幕，算力短缺纷争不断，LLaMA核心作者超半数已经离职。甚至，连大模型开发团队进行了三轮重组，Meta全力赶超谷歌微软的路还有多远？过去6个月，ChatGPT的爆火，彻底让Meta坐不住了。从2月开始开源大模型系列LLaMA的发布，到Llama2升级、再到编码模型CodeLlama，Meta可谓是赌上所有去ALLINAI。在开源社区，Llama系列模型的

320 0 2023-09-06 13:47
完胜 GPT-4，秒杀闭源模型！Code Llama 神秘版本曝光

【新智元导读】Meta开源的CodeLlama即将迎来大波二创，WizardCoder以73.2%的胜率碾压GPT-4。OpenAI员工爆出Llama3能打GPT-4，仍将开源。发布仅2天，CodeLlama再次引爆AI编码的变革。还记得Meta在CodeLlama论文中出现的能够全面持平GPT-4的神秘版本UnnaturalCodeLlama吗？大佬Sebastian在自己博客里做出解释：是使用

207 0 2023-08-27 15:22
Llama-2 首个全方位评测，国内外开源模型大比拼

进入2023年7月，大语言模型（LLM）的发展进入了新阶段，开源成为一个火热的主题。7月6日，上海人工智能实验室与商汤科技等联合发布了书生・浦语开源体系（https://github.com/InternLM），不仅开源了书生・浦语的轻量版本（InternLM-7B），还率先开源了从数据、训练到评测的全链条工具体系，并提供完全免费的商用许可；7月14日，智谱科技开放ChatGLM2-6B免费商用；

409 0 2023-07-24 15:11
650 亿参数大模型预训练方案开源可商用！LLaMA 训练加速 38%，来自明星开源项目

650亿参数大模型的预训练方案，发布即开源。训练速度较传统方案提升38%。这就是由Colossal-AI最新发布的类LLaMA基础大模型预训练方案。要知道，在“百模大战”背景下，谁拥有自家大模型，往往被视为核心竞争力。在这个节点下，愿意开源大模型的公司少之又少。但自己从头训练一个大模型，对技术、资金都有很高要求。由此，Colossal-AI最新的开源动作，可以说是应时势所需了。并且它还不限制商业使

241 0 2023-07-18 13:21
大模型加速涌向移动端！ControlNet 手机出图只需 12 秒，高通 AI 掌门人：LLaMA 也只是时间问题

大模型重塑一切的浪潮，正在加速涌向移动应用。不久前，高通刚在MWC上露了一手纯靠手机跑StableDiffusion，15秒就能出图的骚操作：3个月后的CVPR2023上，参数加量到15亿，ControlNet也已在手机端闪亮登场，出图全程仅用了不到12秒：更令人意想不到的速度是，高通技术公司产品管理高级副总裁兼AI负责人ZiadAsghar透露：从技术角度来说，把这些10亿+参数大模型搬进手机，

200 0 2023-07-13 22:48
消息称 Meta 将发布商用版 LLaMA 大模型

IT之家7月13日消息，据英国《金融时报》，Meta准备发布其人工智能模型的商用版本，允许初创公司和企业在该技术的基础上构建定制软件。此举将使Meta与微软支持的OpenAI和谷歌展开竞争。今年早些时候，Meta向研究人员和学者发布了自有大语言模型LLaMA。三位知情人士表示，新版本将更广泛地提供给企业，并可由企业定制。参考IT之家此前报道，Meta今年2月发布了自家的大型语言模型LLaMA，参数

194 0 2023-07-13 12:44
LLaMa 惊天泄露引爆 ChatGPT 平替狂潮，开源 LLM 领域变天

Meta的LLaMA模型开源，让文本大模型迎来了StableDiffustion时刻。谁都没想到，LLaMA的一场「史诗级」泄漏，产生了一系列表现惊艳的ChatGPT「平替」。谁能想到，一次意外的LLaMA泄漏，竟点燃了开源LLM领域最大的创新火花。一系列表现出色的ChatGPT开源替代品——「羊驼家族」，随后眼花缭乱地登场。开源和基于API的分发之间的摩擦，是生成式AI生态系统中最迫在眉睫的矛盾

234 0 2023-04-11 11:46
Meta 推出 AI 语言模型 LLaMA，一个有着 650 亿参数的大型语言模型

IT之家2月25日消息，Meta在当地时间周五宣布，它将推出一种针对研究社区的基于人工智能(AI)的新型大型语言模型，与微软、谷歌等一众受到ChatGPT刺激的公司一同加入人工智能竞赛。Meta的LLaMA是“大型语言模型MetaAI” （LargeLanguageModelMetaAI）的缩写，它可以在非商业许可下提供给政府、社区和学术界的研究人员和实体工作者。该公司将提供底层代码供用

439 0 2023-02-25 07:02