-
英伟达发布 Llama-3.1-Nemotron-51B AI 模型:创新神经架构搜索等技术让单 H100 GPU 运行 4 倍以上负载
IT之家9月25日消息,英伟达9月23日发布博文,宣布推出Llama-3.1-Nemotron-51BAI模型,源自Meta公司的Llama-3.1-70B,不过创新使用神经架构搜索(NAS)方法,建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B简介Llama-3.1-Nemotron-51BAI模型将于Meta公司2024年7月发布的Llama-3.1-70B模型,共106 0 2024-09-25 13:42
-
Llama3.1 训练平均 3 小时故障一次,H100 万卡集群好脆弱,气温波动都会影响吞吐量
每3个小时1次、平均1天8次,Llama3.1405B预训练老出故障,H100是罪魁祸首?最近有人从Meta发布的92页超长Llama3.1论文中发现了华点:Llama3.1在为期54天的预训练期间,经历了共466次任务中断。其中只有47次是计划内的,419次纯属意外,意外中78%已确认或怀疑是硬件问题导致。而且GPU问题最严重,占了58.7%。Llama3.1405模型是在一个含16384块Nv115 0 2024-07-29 17:57
-
AMD MI300X GPU 测试,性能远超英伟达 H100
IT之家6月27日消息,科技博客ChipsandCheese于6月25日发布博文,详细测试了AMDMI300XGPU,并在高速缓存、延迟、推理等方面对比后发现,性能远超英伟达的H100。MI300X简介AMDInstinctMI300X人工智能加速器基于CDNA3架构打造,采用混合的5nm和6nm制程工艺,最多拥有1530亿晶体管。存储方面也获得了巨大提升,MI300X的HBM3容量比上一代的MI114 0 2024-06-27 11:57
-
9 项测试破 5 项纪录,英伟达 H100 在 MLPerf 中独占鳌头:训练 GPT-3 时间缩短 27%
IT之家6月14日消息,英伟达旗下的H100GPU仍在AI市场独占鳌头,现阶段没有出现威胁其主导地位的竞争对手,在MLPerf最新基准测试中,再次创下了多项新纪录。IT之家注:MLPerf是衡量AI芯片性能的主流基准之一,该平台最新推出了新的测试项目,专门针对微调(Fine-tuning)大语言模型和图神经网络(GNN),而英伟达H100创下了多项纪录。Fine-tuning是指在预训练模型的基础138 0 2024-06-14 11:09
-
英伟达 H100 AI GPU 短缺缓解,交货时间从 3-4 个月降至 2-3 个月
IT之家4月11日消息,曾几何时,英伟达用于人工智能计算的H100GPU供不应求。然而据Digitimes报道,台积电的台湾地区总经理TerenceLiao表示,过去几个月英伟达H100的交货等待时间已经大幅缩短,从最初的3-4个月降至目前的2-3个月(8-12周)。服务器代工厂商也透露,相比2023年几乎无法买到英伟达H100的情况,目前供应瓶颈正在逐步缓解。尽管交货等待时间有所缩短,Teren147 0 2024-04-11 09:39
-
AI 芯片供应问题缓解,消息称部分公司开始转售英伟达 H100 GPU
IT之家2月27日消息,据报道,用于人工智能(AI)和高性能计算(HPC)应用的英伟达H100GPU交货周期大幅缩短,从之前的8-11个月缩减至仅3-4个月。这导致一些囤货的公司正在试图出售其过剩的H10080GB处理器,因为现在从亚马逊云服务、谷歌云和微软Azure等大型公司租用芯片更加方便。据TheInformation报道称,由于稀缺性降低以及维护未使用库存的高昂成本,一些公司正在转售其H1154 0 2024-02-27 14:22
-
3.9 分钟训完 GPT-3,英伟达 H100 再次刷新 MLPerf 六项纪录
IT之家11月9日消息,英伟达今天发布新闻稿,表示旗下的H100GPU在MLPerf基准测试中创造了6项新记录。IT之家今年6月报道,3584个H100GPU群在短短11分钟内完成了基于GPT-3的大规模基准测试。MLPerfLLM基准测试是基于OpenAI的GPT-3模型进行的,包含1750亿个参数。LambdaLabs估计,训练这样一个大模型需要大约3.14E23FLOPS的计算量。英伟达最新177 0 2023-11-09 13:53
-
报告称英伟达二季度 H100 AI GPU 出货量达 900 吨,约 30 万块
IT之家9月17日消息,英伟达的H100人工智能显卡成为业界新宠,销量创下历史新高。研究机构Omdia透露,英伟达在2023年第二季度出货了900吨H100显卡,这是一个非常惊人的数字。这份分析报告有些奇怪,Omdia也没有说明为什么用“重量”来表示显卡的出货数量。猜测Omdia是从某个供应商那里获得了运送数据,根据Omdia的估算,一块H100显卡的重量大约是3公斤。因此,可以推算出英伟达在第二216 0 2023-09-17 16:39
-
推进云计算以及生成式 AI,英伟达 H100 GPU 已对亚马逊 AWS 云服务用户开放
感谢IT之家网友华南吴彦祖的线索投递!IT之家7月30日消息,英伟达官网公告显示,亚马逊云正式推出了由英伟达H100TensorCoreGPU驱动的新的AmazonElasticComputeCloud(EC2)P5实例。据介绍,该服务允许用户通过浏览器轻松扩展生成式AI、高性能计算(HPC)和其他应用。NVIDIAH100GPU的一个重要特点是其对Transformer的优化,这是许多最新的先进253 0 2023-07-30 07:56
-
配 2.2 万片英伟达 H100 GPU,Inflection AI 正开发超级计算机
IT之家7月5日消息,人工智能初创公司InflectionAI近日宣布正在开发一款超级计算机,配备2.2万片英伟达H100GPU,可以满足生成式AI的发展需求。InflectionAI由谷歌DeepMind联合创始人穆斯塔法・苏莱曼(MustafaSuleyman)、招聘平台领英联合创始人里德・霍夫曼(ReidHoffman)创立,专注于开发面向消费者的人工智能产品,被认为是OpenAI的主要竞争251 0 2023-07-05 15:11
-
业内人士:台积电英伟达 A100 和 H100 GPU 代工订单增加
3月21日消息,据媒体Digitimes报道,在晶圆代工领域走在行业前列的台积电,来自英伟达的A100和H100GPU的代工订单在增加。相关媒体是根据业内人士的透露,报道英伟达给予台积电A100和H100GPU的代工订单在增加的,为国内市场设计的A800系列GPU的代工订单也在增加。值得注意的是,英伟达A100、H100及A800系列GPU,都是针对数据中心的产品,这三款GPU的代工订单增加,大概208 0 2023-03-21 15:47
-
英伟达 Hopper 架构 H100 GPU 全面投产,年底将有超 50 款服务器型号面世
IT之家9月21日消息,据英伟达官方消息,英伟达于今日宣布 NVIDIAH100TensorCoreGPU 全面投产,NVIDIA全球技术合作伙伴计划于10月推出首批基于开创性NVIDIAHopper架构的产品和服务。IT之家了解到,H100于2022年4月发布,由800亿个晶体管组成,并采用了众多开创性的技术,包括强大的全新 Transformer 引擎和320 0 2022-09-21 21:46