#gpt4#_标签文章_Nemo社区_LinkNemo_关于分享和探索的好地方

OpenAI GPT-4 解锁新成就：100% 识别性别、74.25% 识别年龄范围，未专门训练可媲美专业算法

IT之家10月10日消息，科技媒体TheDecoder昨日（10月9日）发布博文，报道称最新研究表明OpenAI的GPT-4AI模型在未经专门微调和训练情况下，能够识别面孔、判断性别，并在照片中估计年龄，其准确度媲美专业算法。来自挪威科技大学、Mizani及Idiap研究所的研究人员推进这项研究，测试了GPT-4的生物识别能力，发现其性能和MobileFaceNet等专门的面部识别算法不相上下。在

Echo

96

0

2024-10-10 12:00

OpenAI 的 GPT-4 变身考证能手：无额外训练通过日本理疗师考试，正确率 73.4%

IT之家8月31日消息，一项新的同行评审研究表明，OpenAI的GPT-4大语言模型无需任何额外训练，即可通过日本国家理疗考试。最新发表在《Cureus》杂志上的新研究，测试了GPT-4的文字和视觉技能。IT之家注：日本国家物理理疗师考试包括160道综合题和40道实践题，测试记忆、理解、应用、分析和评估能力。研究人员在GPT-4中输入了1000个问题，并将答案对比了官方解决方案。GPT-4通过了所

Echo

108

0

2024-08-31 09:06

前员工爆料，OpenAI AGI 安全团队已流失近半成员

IT之家8月30日消息，OpenAI一直致力于开发能够造福全人类的人工智能技术，然而最近的一份报告揭示了一个令人担忧的现象：近一半曾专注于超级智能AI长期风险的研究人员已经离开了这家公司。图源Pexels据Fortune报道，OpenAI前治理研究员DanielKokotajlo表示，在过去几个月里，OpenAI几乎一半的AGI安全团队成员已经离职。这引发了外界对公司是否正在忽视AI安全性的担忧。

Echo

139

0

2024-08-30 09:42

OpenAI GPT-4 AI 模型潜力挖掘：高精度建模基础蛋白质结构

IT之家8月22日消息，科技媒体TheDecoder昨日（8月21日）发布博文，报道称罗格斯大学的一项研究表明，OpenAI公司的GPT-4语言模型能高精度模拟简单的氨基酸和蛋白质结构。相关研究成果发表在《ScientificReports》上，该科研团队使用GPT-4AI语言模型，探索其在基本结构生物学任务中的表现，结果发现该AI模型可以准确预测分子结构。科学家们要求GPT-4建立20种标准氨基

Echo

114

0

2024-08-22 08:42

OpenAI 开放 GPT-4o 定制功能，企业可更轻松打造专属 AI 助手

IT之家8月21日消息，OpenAI推出了一项新功能，允许企业客户使用自己的数据来定制其最强大的AI模型GPT-4o。此举旨在应对日益激烈的AI企业应用竞争，并满足企业对AI投资回报的更高要求。所谓定制，即业界所称的“微调（fine-tuning）”。通过微调，现有AI模型可以针对特定任务或领域进行优化。例如，一家滑板公司可以微调AI模型，使其成为能够回答有关轮子和滑板护理问题的客服聊天机器人。此

Echo

104

0

2024-08-21 07:03

菲尔兹奖得主亲测 GPT-4o，经典过河难题破解失败

编辑：桃子乔杨【新智元导读】LLM能否解决「狼-山羊-卷心菜」经典过河难题？最近，菲尔兹奖得主TimothyGowers分享了实测GPT-4o的过程，模型在最简单的题目上竟然做错了，甚至网友们发现，就连Claude3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问题上，如今所有的LLM都失败了！几天前，菲尔兹奖得主、剑桥大学研究主任TimothyGowers直接拿GPT-4o开刀，去解决动物过河

Echo

110

0

2024-06-30 14:18

科大讯飞：星火 V4.0 大模型“对标 GPT-4 Turbo”，6 月 27 日发布多款产品

IT之家6月24日消息，科大讯飞今日发布公告，公司将于2024年6月27日在北京国家会议中心如期发布讯飞星火大模型的最新进展。本次发布会以“懂你的AI助手”为主题，发布讯飞星火大模型V4.0及相关落地应用。官方披露发布会内容：全面提升大模型底座七大核心能力，对标GPT-4Turbo；全新升级讯飞星火App/Desk，发布“个人空间”，打造更懂你的AI助手；全新发布星火智能批阅机，助力教师因材施教；

Echo

120

0

2024-06-24 20:39

研究称 GPT-4 通过了图灵测试，54% 的人将其误认为真人

感谢IT之家网友佳宜的线索投递！IT之家6月17日消息，最新研究称，越来越多的人难以在图灵测试中区分GPT-4和人类。图源Pexels据IT之家了解，“图灵测试”由计算机科学家艾伦・图灵在1950年提出，又被称为“模仿游戏”。测试的标准是机器能否像人类一样进行对话，让对方误以为其是真人。加州大学圣地亚哥分校的研究人员招募了500名参与者，让他们与四位“对话者”进行五分钟的交流，这四位“对话者”分别

Echo

90

0

2024-06-17 14:54

成功率达 53%，研究显示 GPT-4 可自主利用“零日”漏洞攻破网站

IT之家6月9日消息，据NewAtlas报道，研究人员利用自主协作的GPT-4机器人小组成功入侵了一半以上的测试网站，这些机器人可以自主协调行动并根据需要生成新的“帮手”。更令人吃惊的是，他们利用的是以前未知的、现实世界中从未公开的“零日”漏洞（zero-dayvulnerabilities）。图源Pexels早在几个月前，同一批研究人员就发表了一篇论文，声称他们能够使用GPT-4自动利用“Nda

Echo

125

0

2024-06-09 13:09

谷歌 DeepMind：GPT-4 高阶心智理论彻底击败人类！第 6 阶推理讽刺暗示全懂了

感谢IT之家网友刺客的线索投递！刚刚，谷歌DeepMind、JHU、牛津等发布研究，证实GPT-4的心智理论已经完全达到成年人类水平，在更复杂的第6阶推理上，更是大幅超越人类！此前已经证实，GPT-4比人类更能理解语言中的讽刺和暗示。在心智理论上，人类是彻底被LLM甩在后面了。就在刚刚，谷歌DeepMind、约翰斯・霍普金斯大学和牛津大学等机构的学者发布的研究证实，GPT-4在心智理论任务上的表现

Echo

82

0

2024-06-01 15:20

Arena Elo 基准测试：谷歌 Gemini 1.5 Pro 性能媲美 OpenAI GPT-4o

IT之家5月30日消息，谷歌在I/O2024开发者大会上，宣布将Gemini1.5Pro上下文窗口增加至200万个 tokens，那么Gemini1.5Pro性能究竟有多强悍？根据LMSYSOrg公布的总排行榜对比，通过ArenaElo系统的测量，Gemini-1.5-Pro-API-0514和Gemini-Advanced-0514都接近GPT-4o。上述两款模型在中文方面的表现也非常

Echo

95

0

2024-05-30 10:34

OpenAI GPT-4o 推动 ChatGPT 订阅服务需求激增，移动端营收暴涨

IT之家5月20日消息，OpenAI近期发布了旗下最新的人工智能模型GPT-4o，该模型使得该公司移动端应用ChatGPT的营收迎来了史无前例的增长。尽管GPT-4o在官网上可免费使用，但对于移动端的ChatGPT应用来说却并非如此。想要在手机上体验这一最新技术的用户，需要升级到OpenAI的付费订阅服务“ChatGPTPlus”，月费19.99美元（IT之家备注：当前约145元人民币）。图源Pe

Echo

120

0

2024-05-20 23:13

OpenAI 曾秘密测试 GPT-4o，力压群雄登顶聊天机器人竞技场排行榜

IT之家5月14日消息，OpenAI员工WilliamFedus周一在社交平台X证实，近期在LMSYS聊天机器人竞技场(ChatbotArena)上表现优异的神秘聊天机器人“gpt-chatbot”，正是他们刚刚发布的全新人工智能模型GPT-4o。Fedus还透露，GPT-4o在测试中登顶了竞技场排行榜，取得了有史以来的最高分。“GPT-4o是我们最先进的尖端模型，”Fedus在推特上写道，“我们

Echo

132

0

2024-05-14 18:26

GPT-4o 模型登陆微软 Azure OpenAI 服务，性能更强价格更低

IT之家5月14日消息，OpenAI于今日凌晨发布了其最新的旗舰人工智能模型GPT-4o。相比先前版本，GPT-4o实现了诸多升级：速度提升一倍，价格降低50%（百万token的处理成本降至7美元），并且支持每分钟处理高达千万token的数据量。该模型拥有128K的上下文记忆能力，知识截止时间为2023年10月。微软宣布，已通过AzureOpenAI服务提供GPT-4o的预览版本。与以往的模型不同

Echo

153

0

2024-05-14 16:50

OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o：语音对话更流畅，免费提供

IT之家5月14日消息，OpenAI宣布推出其最新旗舰生成式AI模型GPT-4o，该模型将在未来几周内分阶段集成至OpenAI的各个产品之中。最让人惊喜的是，GPT-4o将免费提供给所有用户使用。OpenAI首席技术官穆里・穆拉蒂(MuriMurati)表示，GPT-4o将提供与GPT-4同等水平的智能，但在文本、图像以及语音处理方面均取得了进一步提升。“GPT-4o可以综合利用语音、文本和视觉信

Echo

154

0

2024-05-14 01:34

大模型一对一战斗 75 万轮，GPT-4 夺冠，Llama 3 位列第五

关于Llama3，又有测试结果新鲜出炉——大模型评测社区LMSYS发布了一份大模型排行榜单，Llama3位列第五，英文单项与GPT-4并列第一。不同于其他Benchmark，这份榜单的依据是模型一对一battle，由全网测评者自行命题并打分。最终，Llama3取得了榜单中的第五名，排在前面的是GPT-4的三个不同版本，以及Claude3超大杯Opus。而在英文单项榜单中，Llama3反超了Clau

Echo

119

0

2024-04-23 13:30

GPT-4 整治学术不端：人大 / 浙大团队实测 7000 篇论文，撤稿预测与人类 95% 一致

【新智元导读】人大与浙大学者发现，GPT-4对于论文给出的撤稿预测结果，竟然和人类审稿人有将近95%的相似性。看来大模型虽然有可能引发学术不端，但也有办法维护科研诚信啊。学术论文的撤稿事件时有发生，这不仅损害了科研诚信，也可能对公众信任和科学进展产生负面影响。传统上，学术界依赖同行评审和出版后的读者反馈来识别和纠正问题论文，但这些方法可能无法及时发现所有问题，尤其是在当前科研论文出版数量急剧增加的

Echo

128

0

2024-04-15 12:47

融合视觉能力，OpenAI 向开发人员提供 GPT-4 Turbo with Vision

IT之家4月10日消息，OpenAI宣布，具有视觉能力的最新GPT-4Turbo模型GPT-4TurbowithVision现已通过OpenAIAPI向开发人员普遍提供。据IT之家了解，该模型延续了GPT-4Turbo系列128,000个token的窗口大小以及截止至2023年12月的知识库，最大的革新之处在于其新增的视觉理解能力。在过去，开发者需要调用不同的模型来处理文本和图像信息，而GPT-4

Echo

165

0

2024-04-10 06:56

OpenAI 创始大神手搓千行 C 代码训练 GPT，附 PyTorch 迁移教程

大神卡帕西（AndrejKarpathy）刚“复工”，立马带来神作：纯C语言训练GPT，1000行代码搞定！，不用现成的深度学习框架，纯手搓。发布仅几个小时，已经揽星2.3k。它可以立即编译和运行，和PyTorch完全兼容。卡帕西使用的示例是GPT-2，但Llama2和Gemma等也适用。项目发布后，他还给出了从PyTorch迁移到C的教程。网友们直呼：他甚至都不用C++……而且就连怎么让大模型如

Echo

155

0

2024-04-09 22:21

GPT-4 推理能力为 0？开发者悬赏 1 万美金被打脸，神秘提示正确率直冲 100%

新智元报道编辑：Aeneas好困【新智元导读】小孩子都会的脑筋急转弯推理题，GPT-4和Claude3做不出？国外一位开发者小哥坚称这一观点，认为GPT模型在训练集外毫无推理能力，无法实现AGI，甚至悬赏1万美元，发起比赛。然而，他当天就被光速打脸了！网友用高能的prompt，让GPT-4和Claude3几乎达到百分百的正确率。ChatGPT，再一次

Echo

189

0

2024-04-08 13:43

标签文章：#gpt4#