#ai#_标签文章_Nemo社区_LinkNemo_关于分享和探索的好地方

苹果 Depth Pro AI 模型掀起 AR 变革：零样本学习，单张 2D 图片 0.3 秒内变高清 3D

IT之家10月5日消息，科技媒体venturebeat昨日（10月4日）发布博文，报道称苹果AI科研团队发布了名为DepthPro的全新AI模型，不需要传统相机数据预测，能够在几分之一秒内从单张2D图像生成详细的3D深度图。该论文标题为《DepthPro:SharpMonocularMetricDepthinLessThanaSecond》，是单目深度估计（MonocularDepthEstima

Echo

97

0

2024-10-05 14:12

Meta 发布 AI 视频生成器 Movie Gen：可自动生成含声音的高清视频

IT之家10月4日消息，Meta公司今天宣布了一款新的AI视频生成器MovieGen，该工具能够生成带有声音的高清视频。几个月前，其竞争对手OpenAI也推出了其文本转视频模型Sora。输入文本MovieGen就能自动生成视频，还可以编辑现有的视频或静止图像。据《纽约时报》报道，添加到视频中的音频也是AI生成的，通过环境噪音、音效和背景音乐与视频相匹配，视频支持不同的纵横比。Meta表示，Movi

Echo

110

0

2024-10-04 23:24

最强文生图模型 Flux 再进化：出图速度快 6 倍，Elo 评分冲上 1153 傲视群雄

IT之家10月4日消息，科技媒体TheDecoder昨日（10月3日）发布博文，报道称BlackForestLabs最新推出了Flux1.1Pro，并以Beta版的形式推出BFLAPI。黑森林实验室（BlackForestLabs）是一家位于德国的初创公司，专注于开发最先进的生成性人工智能模型。Flux 简介Flux在AI文生图领域有着“最强”称号，在多个方面有着卓越表现：生成质量：Fl

Echo

80

0

2024-10-04 16:12

Lumigator 评估框架登场：Mozilla 赋能开发者 AI 旅程，助其选择最佳模型

IT之家10月4日消息，Mozilla昨日（10月3日）发布博文，推出了Lumigator新框架，主要帮助开发者为其项目挑选合适的AI大语言模型（LLM）。Mozilla想要解决的问题Mozilla公司在博文中表示，相比较AI大语言模型的繁荣，相关的评估工具尚未跟上发展的步伐，由于没有清晰的统一方法来比较模型，让开发者和企业难以做出明智的选择。MozillaLumigator框架Mozilla在博

Echo

106

0

2024-10-04 13:21

阿尔特曼畅想 AI 未来：“魔镜”变革交互、智能体实现速度跃迁、新硬件奏响时代凯歌

IT之家10月4日消息，科技媒体TheDecoder昨日（10月3日）发布博文，报道称山姆・阿尔特曼（SamAltman）在OpenAI的DevDays活动上，分享了他对人工智能（AI）互动未来的想法。IT之家附上完整演讲视频如下：构想未来 AI 系统阿尔特曼在活动中描述了一种可以改变我们使用计算机和与世界互动方式的人工智能系统。在他勾勒的未来场景中，用户可以走到一块“镜子”前

Echo

96

0

2024-10-04 11:48

OpenAI 获得 40 亿美元周转信贷，公司流动资金破 100 亿美元

IT之家10月4日消息，CNBC昨日（10月3日）发布博文，报道称OpenAI公司在完成66亿美元新一轮融资之外，还获得40亿美元周转信贷，意味着该公司的流动资金超过100亿美元（IT之家备注：当前约703.61亿元人民币）。OpenAI获得了40亿美元周转信贷，参与融资的金融机构包括摩根大通、花旗、高盛、摩根士丹利、桑坦德集团、富国银行、SMBC、瑞士银行和汇丰银行。报道称OpenAI的基础信用

Echo

99

0

2024-10-04 11:06

谷歌 CEO 皮查伊：将加大对清洁能源的投资，正考虑用核能为数据中心供电以满足 AI 项目需求

IT之家10月3日消息，谷歌CEO桑达尔・皮查伊在接受《日经新闻》采访时阐述了谷歌对于优先发展生成式AI的理念和态度，还谈到了谷歌在满足AI项目巨大能耗需求方面的举措，在考虑用核电站为数据中心供电、增加对太阳能和热能的投资等。为了更好地开发和运营其生成式人工智能项目，这家美国公司一直在加大对数据中心方面的投资。其母公司Alphabet在2024年第二季度资本支出较上年同期增加了约90%，按现金流计

Echo

101

0

2024-10-03 19:03

英特尔新版 AI Playground 上线：酷睿 Ultra 200V 笔记本处理器专享主题，本地模型驾驭文生图等任务

IT之家10月3日消息，英特尔公司于10月1日发布博文，宣布针对英特尔酷睿Ultra200V系列“LunarLake”笔记本处理器，升级了AIPlayground应用程序。英特尔AIPlayground简介英特尔的AIPlayground是一个开源应用程序，旨在为用户提供简单易用的人工智能功能，特别是针对使用英特尔Arc显卡的用户。官方介绍如下：AIPlayground可免费下载且易于使用，帮助您

Echo

83

0

2024-10-03 15:45

摩根大通：苹果牌 AI 技能待解锁，暂未“引爆” iPhone 16 系列销量

IT之家10月3日消息，科技媒体AppleInsider昨日（10月2日）发布博文，报道称投资银行摩根大通（JPMorgan）认为，AppleIntelligence并未“引爆”iPhone16系列。摩根大通调查用户反馈和监测iPhone16系列的销量数据后，认为现阶段AppleIntelligence并未推动iPhone16系列销量，可能是苹果尚未解锁完整版AI功能，因此对初期订单的“拉动能力较

Echo

92

0

2024-10-03 10:24

Meta 智能眼镜被改造成“搭讪神器”：AI 人脸识别，联网搜刮姓名等背景

IT之家10月3日消息，科技媒体404Media昨日（10月2日）发布博文，报道来自哈佛大学的两名学生改造MetaxRay-Ban智能眼镜，添加了基于AI的人脸识别技术，可以实时识别陌生人。AnhPhuNguyen和CaineArdayfio两位学生演示了改造后的MetaxRay-Ban智能眼镜，可以调用眼镜上的相机拍摄陌生人，然后通过面部识别获取他们的名字。IT之家附上相关视频如下：此外两人还改

Echo

108

0

2024-10-03 09:36

谷歌追赶 OpenAI，加速推进会“思考”的 AI 通用推理模型

感谢IT之家网友Diixx的线索投递！IT之家10月3日消息，彭博社昨日（10月2日）报道，谷歌公司正在开发类人推理AI，希望在进度方面追赶OpenAI公司的o1模型。OpenAI最近为ChatGPT引入了o1-preview和o1-mini模型，可以模拟人类的思考模式，实现通用推理，让AI实现“思考”。IT之家援引彭博社报道，谷歌公司目前也在积极推进通用推理AI模型的落地，该AI模型更擅长处理数

Echo

93

0

2024-10-03 07:48

10 倍速度提升，新版 Dream Machineds 可在 20 秒内极速生成高质量 AI 视频

IT之家10月2日消息，科技媒体TheDecoder昨日（10月1日）发布博文，报道称LumaAI升级推出1.6版DreamMachine，AI视频生成速度快10倍。LumaAI简介LumaAI是一家专注于人工智能技术的公司，主要提供视频生成和3D捕捉的解决方案。DreamMachine简介DreamMachine是一个先进的文本转视频生成器，用户可以通过输入文本来创建引人注目的视频。这项技术旨在

Echo

64

0

2024-10-02 14:30

微调 GPT-4o AI 模型新维度，OpenAI 开放图片视觉微调功能

IT之家10月2日消息，OpenAI公司昨日（10月1日）发布博文，宣布为GPT-4o模型引入视觉微调（visionfine-tuning）功能，除了文本之外还支持微调图像。OpenAI表示自开放微调GPT-4o以来，数十万开发者使用数据集（仅文本）微调了该模型，从而提高了驾驭某些特定任务的能力。OpenAI在博文中展示了一些合作伙伴的微调案例：Garb：通过视觉微调，提升了交通标志定位准确性20

Echo

67

0

2024-10-02 14:03

OpenAI 发布 Realtime API，助力第三方应用集成其语音合成技术

IT之家10月2日消息，科技媒体TheDecoder昨日（10月1日）发布博文，报道称OpenAI在旧金山开发者大会（DevDay）上，发布了RealtimeAPI，可以让开发者调用该API在第三方应用中集成语音合成技术。OpenAI表示开发者通过调用新的RealtimeAPI，可以在其应用中添加6种AI语音，IT之家注：OpenAI 为了避免法律问题，开发者不能使用第三方语音。Open

Echo

100

0

2024-10-02 13:45

英伟达修复 9/10 高危漏洞：可从容器逃逸，影响所有依赖 Container Toolkit 的 AI 应用

感谢IT之家网友溯波的线索投递！IT之家10月2日消息，WizResearch于9月26日发布博文，报道称英伟达容器工具包（NVIDIAContainerToolkit）存在高危漏洞，影响所有依赖于该工具访问GPU资源的AI应用程序。该漏洞追踪编号为CVE-2024-0132，攻击者可以执行容器逃逸攻击，获得主机系统的完全访问权限，从而执行命令或窃取敏感信息。许多以AI为中心的平台和虚拟机镜像会预

Echo

79

0

2024-10-02 11:42

郭明錤称英伟达停止开发双柜版本 GB200（NVL36*2）AI 机柜

感谢IT之家网友風見暉一的线索投递！IT之家10月2日消息，郭明錤昨日（10月1日）发布市场投资简报，报道称在没有客户定制要求的情况下，英伟达不再提供双柜版GB200（2个NVL36），仅提供单柜版本GB200NVL72，而单柜版NVL36仍维持原开发和出货计划。IT之家附上郭明錤简报信息如下：结论：此事不会影响 AI与Nvidia的长期正向趋势，但短期可能引发部分市场参与者对Nvidi

Echo

71

0

2024-10-02 10:18

安卓版谷歌 Gemini Live 上线，助力 AI 开启全民语音聊天时代

IT之家10月2日消息，谷歌公司昨日（10月1日）在X平台发布推文，宣布通过Gemini应用，现面向所有安卓用户开放GeminiLive功能。IT之家曾于8月报道，谷歌在Pixel9系列手机发布会上，发布了GeminiLive，该服务提供了一种移动对话体验，让用户和Gemini展开自由流畅的对话。GeminiLive可以说是对标OpenAIChatGPT最新上线的AdvancedVoice模式，采

Echo

89

0

2024-10-02 09:15

真相待解：雷朋 x Meta 智能眼镜密布收集照片训练 AI 疑云

IT之家10月2日消息，科技媒体TechCrunch于9月30日发布博文，报道称Meta公司携手雷朋Ray-Bans推出的AR智能眼镜配有摄像头，可能存在收集用户信息训练AI的情况。IT之家援引该媒体报道，该眼镜上的摄像头不仅会在用户要求时拍照，而且会在“看”（look）等特殊关键词的情况下，触发时自动拍照。包括无意识拍摄的图像在内，意味着智能眼镜会收集大量照片，而官方没有承诺保护这些图像数据。该

Echo

65

0

2024-10-02 07:36

AI 芯片厂商 Cerebras 计划 IPO：剑指英伟达，计划筹集 8 亿美元

IT之家10月1日消息，美国CNBC昨日（9月30日）报道，AI芯片初创公司CerebrasSystems周一提交了首次公开募股（IPO）的招股说明书，计划在纳斯达克以“CBRS”的股票代码进行交易，本次 IPO 预估最多筹集8亿美元（IT之家备注：当前约56.09亿元人民币）。根据Cerebras披露的文件，该公司相关财报数据如下：2024年第2季度净亏损为5090万美元（当

Echo

86

0

2024-10-01 14:54

OpenAI 引领 AI 浪潮：任务处理从 5 秒延至 5 小时，颠覆营销思维和模式

IT之家10月1日消息，科技媒体TheDecoder昨日（9月30日）发布博文，报道称在Hubspot的Inbound活动上，OpenAI战略营销负责人DaneVahey表示o1模型可以处理5小时的任务。营销人员需要提高AI技能Vahey认为，随着营销任务变得越来越复杂，人工智能正变得越来越重要，专业人士需要以更低的获取成本和更少的资源实现相同的结果。虽然许多公司已经在营销中使用人工智能，特别是在

Echo

71

0

2024-10-01 14:36

标签文章：#ai#