Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,679,512字

标签 > 标签文章:#llama# (共有20文章)

  • Llama 版 o1 大模型发布:来自上海 AI Lab,强化学习代码已开源

    Llama 版 o1 大模型发布:来自上海 AI Lab,强化学习代码已开源
    复刻OpenAIo1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AILab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGoZero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发布之前,团队就开始探索蒙特卡洛树搜索提高大模型数学能力,积累了一些关注。这次最新开源代码,也在开发者社区引起热议。OpenAIo1系列发

     74    0    2024-11-05 12:54

  • Meta 推出 Llama 3.2 1B / 3B 模型量化版:功耗更低、可适用更多轻量移动设备

    Meta 推出 Llama 3.2 1B / 3B 模型量化版:功耗更低、可适用更多轻量移动设备
    IT之家10月27日消息,继今年9月开源Llama3.2的1B与3B模型之后,Meta于10月24日发布了这两个模型的量化版本,量化后的模型大小平均减少了56%,RAM使用量平均减少了41%,模型速度提高了2至4倍,同时降低了功耗,使这些模型能够部署到更多移动设备上。IT之家注:模型量化(ModelQuantization)就是通过各种训练方式将浮点模型转为定点模型,可以压缩模型参数,降低模型的复

     80    0    2024-10-27 13:57

  • 端侧最强开源 AI 模型 Llama 3.2 登场:从 1B 纯文本到 90B 多模态,手机上可运行,挑战 OpenAI 4o mini

    端侧最强开源 AI 模型 Llama 3.2 登场:从 1B 纯文本到 90B 多模态,手机上可运行,挑战 OpenAI 4o mini
    IT之家9月26日消息,Meta公司昨日(9月25日)发布博文,正式推出了Llama3.2AI模型,其特点是开放和可定制,开发者可以根据其需求定制实现边缘人工智能和视觉革命。Llama3.2提供了多模态视觉和轻量级模型,代表了Meta在大型语言模型(LLMs)方面的最新进展,在各种使用案例中提供了更强大的功能和更广泛的适用性。其中包括适合边缘和移动设备的中小型视觉LLMs(11B和90B),以及轻

     117    0    2024-09-26 07:03

  • Meta 公布 Llama AI 模型家族下载量数据:全球超 3.5 亿、3.1-405B 模型最受欢迎

    Meta 公布 Llama AI 模型家族下载量数据:全球超 3.5 亿、3.1-405B 模型最受欢迎
    IT之家9月3日消息,Meta公司昨日发布新闻稿披露了旗下Llama开源 AI 模型家族在HuggingFace的下载量情况,仅在上个月(8月1日-8月31日),相关模型的下载次数就超过了2000万次,截至 9 月 1 日,Llama 模型家族全球下载量已突破 3.5 亿次。参考IT之家报道,Meta公司在今

     148    0    2024-09-03 21:57

  • 小扎自曝砸重金训 Meta Llama 4 模型:24 万块 GPU 齐发力,预计 2025 年发布

    小扎自曝砸重金训 Meta Llama 4 模型:24 万块 GPU 齐发力,预计 2025 年发布
    Llama3.1刚发布不久,Llama4已完全投入训练中。这几天,小扎在二季度财报会上称,Meta将用Llama3的十倍计算量,训练下一代多模态Llama4,预计在2025年发布。这笔账单,老黄又成为最大赢家十倍计算量,是什么概念?要知道,Llama3是在两个拥有24,000块GPU集群完成训练。也就是说,Llama4训练要用24万块GPU。那么,Meta存货还够不够?还记得小扎曾在年初宣布,计划

     99    0    2024-08-05 13:33

  • Llama 3.1 上线就被攻破:大骂小扎,危险配方张口就来,指令遵循能力强了更容易越狱

    Llama 3.1 上线就被攻破:大骂小扎,危险配方张口就来,指令遵循能力强了更容易越狱
    最强大模型Llama3.1,上线就被攻破了。对着自己的老板扎克伯格破口大骂,甚至知道如何绕过屏蔽词。设计危险病毒、如何黑掉Wifi也是张口就来。Llama3.1405B超越GPT-4o,开源大模型登顶了,副作用是危险也更多了。不过也不全是坏事。Llama系列前几个版本一直因为过度安全防护,还一度饱受一些用户批评:连一个Linux进程都不肯“杀死”,实用性太差了。现在,3.1版本能力加强,也终于明白

     94    0    2024-07-24 13:03

  • Meta 发布 Llama 3.1 开源大语言模型:128K 上下文长度,405B 版可与 GPT-4o 和 Claude 3.5 Sonnet 媲美

    Meta 发布 Llama 3.1 开源大语言模型:128K 上下文长度,405B 版可与 GPT-4o 和 Claude 3.5 Sonnet 媲美
    感谢IT之家网友航空先生的线索投递!IT之家7月23日消息,Meta今晚正式发布 Llama3.1 开源大语言模型,提供8B、70B及 405B参数版本。据介绍,Llama3.1系列改进了推理能力及多语言支持,上下文长度提升至128K,首次推出405B参数的旗舰模型。Meta称4050亿参数的 Llama3.1-405B在常识、可引导性、数学、工具使用和多语

     116    0    2024-07-23 23:39

  • 开源 AI 模型挑战闭源里程碑?Meta Llama 3.1-405B 多项跑分超越 OpenAI GPT-4o

    开源 AI 模型挑战闭源里程碑?Meta Llama 3.1-405B 多项跑分超越 OpenAI GPT-4o
    IT之家7月23日消息,网友在LocalLLaMA子Reddit板块中发帖,分享了4050亿参数的MetaLlama3.1信息,从该AI模型在几个关键AI基准测试的结果来看,其性能超越目前的领先者(OpenAI的GPT-4o)。这是开源人工智能社区的一个重要里程碑,标志着开源模型可能首次击败目前最先进的闭源LLM模型。如基准测试所示,MetaLlama3.1在GSM8K、Hellaswag、boo

     116    0    2024-07-23 07:27

  • 13 项测试仅通过 4 项,Meta 的 Llama 2 LLM 被指安全性低:幻觉率 48%

    13 项测试仅通过 4 项,Meta 的 Llama 2 LLM 被指安全性低:幻觉率 48%
    IT之家4月18日消息,AI安全公司DeepKeep近日发布评估报告,在13个风险评估类别中,Meta公司的Llama2大语言模型仅通过4项测试。报告称70亿参数的Llama27B模型幻觉(回答内容存在虚假,或者有误导性内容)最为严重,幻觉率高达48%。DeepKeep表示:“结果表明,模型有明显的幻觉倾向,提供正确答案或编造回答的可能性对半开,而幻觉率最高,那么向用户传递的错误信息越多”。除了幻

     131    0    2024-04-18 11:37

  • 李开复回应 Yi 大模型套壳 LLaMA 争议:受益于开源也贡献开源

    李开复回应 Yi 大模型套壳 LLaMA 争议:受益于开源也贡献开源
    感谢IT之家网友爱合租的线索投递!IT之家11月16日消息,针对近日零一万物被质疑完全使用LLaMA架构,只对两个张量(Tensor)名称做修改,李开复在朋友圈进行了回应。李开复表示:“全球大模型架构一路从GPT2-->Gopher-->Chinchilla-->Llama2-->Yi,行业逐渐形成大模型的通用标准,就像做一个手机App开发者,不会去自创iOS、Androi

     191    0    2023-11-16 12:16

  • 李开复旗下 AI 公司 “零一万物” 开源 Yi 大模型被指抄袭 LLaMA

    李开复旗下 AI 公司 “零一万物” 开源 Yi 大模型被指抄袭 LLaMA
    IT之家11月14日消息,创新工场董事长兼CEO李开复于今年创办了AI大模型创业公司“零一万物”,该公司已推出 Yi-34B和 Yi-6B两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。然而在 Yi-34B的HuggingFace开源主页上,开发者ehartford质疑称该模型使用了 MetaLLaMA的架构,只对两个张量(Tensor)名称进

     223    0    2023-11-14 13:34

  • 百川智能发布 Baichuan 2 开源大模型,号称“文理兼备全面领先 LLaMA 2”

    百川智能发布 Baichuan 2 开源大模型,号称“文理兼备全面领先 LLaMA 2”
    IT之家9月6日消息,百川智能今日召开主题为“百川汇海,开源共赢”的大模型发布会,正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本,并且均为免费可商用。百川智能此次还开源了模型训练的CheckPoint,并宣布将发布Baichuan2技术报告,详细介绍Baichuan2的训练细节,IT之家附Baichuan2下载地址:h

     379    0    2023-09-06 18:25

  • LLaMA 核心原作多半离职,Meta AI 内幕曝光!算力争夺撕破脸,大模型团队成员连换三轮

    LLaMA 核心原作多半离职,Meta AI 内幕曝光!算力争夺撕破脸,大模型团队成员连换三轮
    【新智元导读】Meta内部上演了最戏剧性的一幕,算力短缺纷争不断,LLaMA核心作者超半数已经离职。甚至,连大模型开发团队进行了三轮重组,Meta全力赶超谷歌微软的路还有多远?过去6个月,ChatGPT的爆火,彻底让Meta坐不住了。从2月开始开源大模型系列LLaMA的发布,到Llama2升级、再到编码模型CodeLlama,Meta可谓是赌上所有去ALLINAI。在开源社区,Llama系列模型的

     320    0    2023-09-06 13:47

  • 完胜 GPT-4,秒杀闭源模型!Code Llama 神秘版本曝光

    完胜 GPT-4,秒杀闭源模型!Code Llama 神秘版本曝光
    【新智元导读】Meta开源的CodeLlama即将迎来大波二创,WizardCoder以73.2%的胜率碾压GPT-4。OpenAI员工爆出Llama3能打GPT-4,仍将开源。发布仅2天,CodeLlama再次引爆AI编码的变革。还记得Meta在CodeLlama论文中出现的能够全面持平GPT-4的神秘版本UnnaturalCodeLlama吗?大佬Sebastian在自己博客里做出解释:是使用

     207    0    2023-08-27 15:22

  • Llama-2 首个全方位评测,国内外开源模型大比拼

    Llama-2 首个全方位评测,国内外开源模型大比拼
    进入2023年7月,大语言模型(LLM)的发展进入了新阶段,开源成为一个火热的主题。7月6日,上海人工智能实验室与商汤科技等联合发布了书生・浦语开源体系(https://github.com/InternLM),不仅开源了书生・浦语的轻量版本(InternLM-7B),还率先开源了从数据、训练到评测的全链条工具体系,并提供完全免费的商用许可;7月14日,智谱科技开放ChatGLM2-6B免费商用;

     409    0    2023-07-24 15:11

  • 650 亿参数大模型预训练方案开源可商用!LLaMA 训练加速 38%,来自明星开源项目

    650 亿参数大模型预训练方案开源可商用!LLaMA 训练加速 38%,来自明星开源项目
    650亿参数大模型的预训练方案,发布即开源。训练速度较传统方案提升38%。这就是由Colossal-AI最新发布的类LLaMA基础大模型预训练方案。要知道,在“百模大战”背景下,谁拥有自家大模型,往往被视为核心竞争力。在这个节点下,愿意开源大模型的公司少之又少。但自己从头训练一个大模型,对技术、资金都有很高要求。由此,Colossal-AI最新的开源动作,可以说是应时势所需了。并且它还不限制商业使

     241    0    2023-07-18 13:21

  • 大模型加速涌向移动端!ControlNet 手机出图只需 12 秒,高通 AI 掌门人:LLaMA 也只是时间问题

    大模型加速涌向移动端!ControlNet 手机出图只需 12 秒,高通 AI 掌门人:LLaMA 也只是时间问题
    大模型重塑一切的浪潮,正在加速涌向移动应用。不久前,高通刚在MWC上露了一手纯靠手机跑StableDiffusion,15秒就能出图的骚操作:3个月后的CVPR2023上,参数加量到15亿,ControlNet也已在手机端闪亮登场,出图全程仅用了不到12秒:更令人意想不到的速度是,高通技术公司产品管理高级副总裁兼AI负责人ZiadAsghar透露:从技术角度来说,把这些10亿+参数大模型搬进手机,

     200    0    2023-07-13 22:48

  • 消息称 Meta 将发布商用版 LLaMA 大模型

    消息称 Meta 将发布商用版 LLaMA 大模型
    IT之家7月13日消息,据英国《金融时报》,Meta准备发布其人工智能模型的商用版本,允许初创公司和企业在该技术的基础上构建定制软件。此举将使Meta与微软支持的OpenAI和谷歌展开竞争。今年早些时候,Meta向研究人员和学者发布了自有大语言模型LLaMA。三位知情人士表示,新版本将更广泛地提供给企业,并可由企业定制。参考IT之家此前报道,Meta今年2月发布了自家的大型语言模型LLaMA,参数

     194    0    2023-07-13 12:44

  • LLaMa 惊天泄露引爆 ChatGPT 平替狂潮,开源 LLM 领域变天

    LLaMa 惊天泄露引爆 ChatGPT 平替狂潮,开源 LLM 领域变天
    Meta的LLaMA模型开源,让文本大模型迎来了StableDiffustion时刻。谁都没想到,LLaMA的一场「史诗级」泄漏,产生了一系列表现惊艳的ChatGPT「平替」。谁能想到,一次意外的LLaMA泄漏,竟点燃了开源LLM领域最大的创新火花。一系列表现出色的ChatGPT开源替代品——「羊驼家族」,随后眼花缭乱地登场。开源和基于API的分发之间的摩擦,是生成式AI生态系统中最迫在眉睫的矛盾

     234    0    2023-04-11 11:46

  • Meta 推出 AI 语言模型 LLaMA,一个有着 650 亿参数的大型语言模型

    Meta 推出 AI 语言模型 LLaMA,一个有着 650 亿参数的大型语言模型
    IT之家2月25日消息,Meta在当地时间周五宣布,它将推出一种针对研究社区的基于人工智能(AI)的新型大型语言模型,与微软、谷歌等一众受到ChatGPT刺激的公司一同加入人工智能竞赛。Meta的LLaMA是“大型语言模型MetaAI” (LargeLanguageModelMetaAI)的缩写,它可以在非商业许可下提供给政府、社区和学术界的研究人员和实体工作者。该公司将提供底层代码供用

     439    0    2023-02-25 07:02

  • 1