标签文章:#gpt4#
-
OpenAI GPT-4 解锁新成就:100% 识别性别、74.25% 识别年龄范围,未专门训练可媲美专业算法
IT之家10月10日消息,科技媒体TheDecoder昨日(10月9日)发布博文,报道称最新研究表明OpenAI的GPT-4AI模型在未经专门微调和训练情况下,能够识别面孔、判断性别,并在照片中估计年龄,其准确度媲美专业算法。来自挪威科技大学、Mizani及Idiap研究所的研究人员推进这项研究,测试了GPT-4的生物识别能力,发现其性能和MobileFaceNet等专门的面部识别算法不相上下。在
-
OpenAI 的 GPT-4 变身考证能手:无额外训练通过日本理疗师考试,正确率 73.4%
IT之家8月31日消息,一项新的同行评审研究表明,OpenAI的GPT-4大语言模型无需任何额外训练,即可通过日本国家理疗考试。最新发表在《Cureus》杂志上的新研究,测试了GPT-4的文字和视觉技能。IT之家注:日本国家物理理疗师考试包括160道综合题和40道实践题,测试记忆、理解、应用、分析和评估能力。研究人员在GPT-4中输入了1000个问题,并将答案对比了官方解决方案。GPT-4通过了所
-
前员工爆料,OpenAI AGI 安全团队已流失近半成员
IT之家8月30日消息,OpenAI一直致力于开发能够造福全人类的人工智能技术,然而最近的一份报告揭示了一个令人担忧的现象:近一半曾专注于超级智能AI长期风险的研究人员已经离开了这家公司。图源Pexels据Fortune报道,OpenAI前治理研究员DanielKokotajlo表示,在过去几个月里,OpenAI几乎一半的AGI安全团队成员已经离职。这引发了外界对公司是否正在忽视AI安全性的担忧。
-
OpenAI GPT-4 AI 模型潜力挖掘:高精度建模基础蛋白质结构
IT之家8月22日消息,科技媒体TheDecoder昨日(8月21日)发布博文,报道称罗格斯大学的一项研究表明,OpenAI公司的GPT-4语言模型能高精度模拟简单的氨基酸和蛋白质结构。相关研究成果发表在《ScientificReports》上,该科研团队使用GPT-4AI语言模型,探索其在基本结构生物学任务中的表现,结果发现该AI模型可以准确预测分子结构。科学家们要求GPT-4建立20种标准氨基
-
OpenAI 开放 GPT-4o 定制功能,企业可更轻松打造专属 AI 助手
IT之家8月21日消息,OpenAI推出了一项新功能,允许企业客户使用自己的数据来定制其最强大的AI模型GPT-4o。此举旨在应对日益激烈的AI企业应用竞争,并满足企业对AI投资回报的更高要求。所谓定制,即业界所称的“微调(fine-tuning)”。通过微调,现有AI模型可以针对特定任务或领域进行优化。例如,一家滑板公司可以微调AI模型,使其成为能够回答有关轮子和滑板护理问题的客服聊天机器人。此
-
菲尔兹奖得主亲测 GPT-4o,经典过河难题破解失败
编辑:桃子乔杨【新智元导读】LLM能否解决「狼-山羊-卷心菜」经典过河难题?最近,菲尔兹奖得主TimothyGowers分享了实测GPT-4o的过程,模型在最简单的题目上竟然做错了,甚至网友们发现,就连Claude3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问题上,如今所有的LLM都失败了!几天前,菲尔兹奖得主、剑桥大学研究主任TimothyGowers直接拿GPT-4o开刀,去解决动物过河
-
科大讯飞:星火 V4.0 大模型“对标 GPT-4 Turbo”,6 月 27 日发布多款产品
IT之家6月24日消息,科大讯飞今日发布公告,公司将于2024年6月27日在北京国家会议中心如期发布讯飞星火大模型的最新进展。本次发布会以“懂你的AI助手”为主题,发布讯飞星火大模型V4.0及相关落地应用。官方披露发布会内容:全面提升大模型底座七大核心能力,对标GPT-4Turbo;全新升级讯飞星火App/Desk,发布“个人空间”,打造更懂你的AI助手;全新发布星火智能批阅机,助力教师因材施教;
-
研究称 GPT-4 通过了图灵测试,54% 的人将其误认为真人
感谢IT之家网友佳宜的线索投递!IT之家6月17日消息,最新研究称,越来越多的人难以在图灵测试中区分GPT-4和人类。图源Pexels据IT之家了解,“图灵测试”由计算机科学家艾伦・图灵在1950年提出,又被称为“模仿游戏”。测试的标准是机器能否像人类一样进行对话,让对方误以为其是真人。加州大学圣地亚哥分校的研究人员招募了500名参与者,让他们与四位“对话者”进行五分钟的交流,这四位“对话者”分别
-
成功率达 53%,研究显示 GPT-4 可自主利用“零日”漏洞攻破网站
IT之家6月9日消息,据NewAtlas报道,研究人员利用自主协作的GPT-4机器人小组成功入侵了一半以上的测试网站,这些机器人可以自主协调行动并根据需要生成新的“帮手”。更令人吃惊的是,他们利用的是以前未知的、现实世界中从未公开的“零日”漏洞(zero-dayvulnerabilities)。图源Pexels早在几个月前,同一批研究人员就发表了一篇论文,声称他们能够使用GPT-4自动利用“Nda
-
谷歌 DeepMind:GPT-4 高阶心智理论彻底击败人类!第 6 阶推理讽刺暗示全懂了
感谢IT之家网友刺客的线索投递!刚刚,谷歌DeepMind、JHU、牛津等发布研究,证实GPT-4的心智理论已经完全达到成年人类水平,在更复杂的第6阶推理上,更是大幅超越人类!此前已经证实,GPT-4比人类更能理解语言中的讽刺和暗示。在心智理论上,人类是彻底被LLM甩在后面了。就在刚刚,谷歌DeepMind、约翰斯・霍普金斯大学和牛津大学等机构的学者发布的研究证实,GPT-4在心智理论任务上的表现
-
Arena Elo 基准测试:谷歌 Gemini 1.5 Pro 性能媲美 OpenAI GPT-4o
IT之家5月30日消息,谷歌在I/O2024开发者大会上,宣布将Gemini1.5Pro上下文窗口增加至200万个 tokens,那么Gemini1.5Pro性能究竟有多强悍?根据LMSYSOrg公布的总排行榜对比,通过ArenaElo系统的测量,Gemini-1.5-Pro-API-0514和Gemini-Advanced-0514都接近GPT-4o。上述两款模型在中文方面的表现也非常
-
OpenAI GPT-4o 推动 ChatGPT 订阅服务需求激增,移动端营收暴涨
IT之家5月20日消息,OpenAI近期发布了旗下最新的人工智能模型GPT-4o,该模型使得该公司移动端应用ChatGPT的营收迎来了史无前例的增长。尽管GPT-4o在官网上可免费使用,但对于移动端的ChatGPT应用来说却并非如此。想要在手机上体验这一最新技术的用户,需要升级到OpenAI的付费订阅服务“ChatGPTPlus”,月费19.99美元(IT之家备注:当前约145元人民币)。图源Pe
-
OpenAI 曾秘密测试 GPT-4o,力压群雄登顶聊天机器人竞技场排行榜
IT之家5月14日消息,OpenAI员工WilliamFedus周一在社交平台X证实,近期在LMSYS聊天机器人竞技场(ChatbotArena)上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型GPT-4o。Fedus还透露,GPT-4o在测试中登顶了竞技场排行榜,取得了有史以来的最高分。“GPT-4o是我们最先进的尖端模型,”Fedus在推特上写道,“我们
-
GPT-4o 模型登陆微软 Azure OpenAI 服务,性能更强价格更低
IT之家5月14日消息,OpenAI于今日凌晨发布了其最新的旗舰人工智能模型GPT-4o。相比先前版本,GPT-4o实现了诸多升级:速度提升一倍,价格降低50%(百万token的处理成本降至7美元),并且支持每分钟处理高达千万token的数据量。该模型拥有128K的上下文记忆能力,知识截止时间为2023年10月。微软宣布,已通过AzureOpenAI服务提供GPT-4o的预览版本。与以往的模型不同
-
OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o:语音对话更流畅,免费提供
IT之家5月14日消息,OpenAI宣布推出其最新旗舰生成式AI模型GPT-4o,该模型将在未来几周内分阶段集成至OpenAI的各个产品之中。最让人惊喜的是,GPT-4o将免费提供给所有用户使用。OpenAI首席技术官穆里・穆拉蒂(MuriMurati)表示,GPT-4o将提供与GPT-4同等水平的智能,但在文本、图像以及语音处理方面均取得了进一步提升。“GPT-4o可以综合利用语音、文本和视觉信
-
大模型一对一战斗 75 万轮,GPT-4 夺冠,Llama 3 位列第五
关于Llama3,又有测试结果新鲜出炉——大模型评测社区LMSYS发布了一份大模型排行榜单,Llama3位列第五,英文单项与GPT-4并列第一。不同于其他Benchmark,这份榜单的依据是模型一对一battle,由全网测评者自行命题并打分。最终,Llama3取得了榜单中的第五名,排在前面的是GPT-4的三个不同版本,以及Claude3超大杯Opus。而在英文单项榜单中,Llama3反超了Clau
-
GPT-4 整治学术不端:人大 / 浙大团队实测 7000 篇论文,撤稿预测与人类 95% 一致
【新智元导读】人大与浙大学者发现,GPT-4对于论文给出的撤稿预测结果,竟然和人类审稿人有将近95%的相似性。看来大模型虽然有可能引发学术不端,但也有办法维护科研诚信啊。学术论文的撤稿事件时有发生,这不仅损害了科研诚信,也可能对公众信任和科学进展产生负面影响。传统上,学术界依赖同行评审和出版后的读者反馈来识别和纠正问题论文,但这些方法可能无法及时发现所有问题,尤其是在当前科研论文出版数量急剧增加的
-
融合视觉能力,OpenAI 向开发人员提供 GPT-4 Turbo with Vision
IT之家4月10日消息,OpenAI宣布,具有视觉能力的最新GPT-4Turbo模型GPT-4TurbowithVision现已通过OpenAIAPI向开发人员普遍提供。据IT之家了解,该模型延续了GPT-4Turbo系列128,000个token的窗口大小以及截止至2023年12月的知识库,最大的革新之处在于其新增的视觉理解能力。在过去,开发者需要调用不同的模型来处理文本和图像信息,而GPT-4
-
OpenAI 创始大神手搓千行 C 代码训练 GPT,附 PyTorch 迁移教程
大神卡帕西(AndrejKarpathy)刚“复工”,立马带来神作:纯C语言训练GPT,1000行代码搞定!,不用现成的深度学习框架,纯手搓。发布仅几个小时,已经揽星2.3k。它可以立即编译和运行,和PyTorch完全兼容。卡帕西使用的示例是GPT-2,但Llama2和Gemma等也适用。项目发布后,他还给出了从PyTorch迁移到C的教程。网友们直呼:他甚至都不用C++……而且就连怎么让大模型如
-
GPT-4 推理能力为 0?开发者悬赏 1 万美金被打脸,神秘提示正确率直冲 100%
新智元报道 编辑:Aeneas好困【新智元导读】小孩子都会的脑筋急转弯推理题,GPT-4和Claude3做不出?国外一位开发者小哥坚称这一观点,认为GPT模型在训练集外毫无推理能力,无法实现AGI,甚至悬赏1万美元,发起比赛。然而,他当天就被光速打脸了!网友用高能的prompt,让GPT-4和Claude3几乎达到百分百的正确率。ChatGPT,再一次