Echo

关注TA

大家好，我是Echo！

普罗旺斯
自由职业
写了309,960,119字

标签 > 标签文章：#o1模型# (共有3文章)

Llama 版 o1 大模型发布：来自上海 AI Lab，强化学习代码已开源

复刻OpenAIo1推理大模型，开源界传来最新进展：LLaMA版o1项目刚刚发布，来自上海AILab团队。简介中明确：使用了蒙特卡洛树搜索，Self-Play强化学习，PPO，以及AlphaGoZero的双重策略范式（先验策略+价值评估）。在2024年6月，o1发布之前，团队就开始探索蒙特卡洛树搜索提高大模型数学能力，积累了一些关注。这次最新开源代码，也在开发者社区引起热议。OpenAIo1系列发

77 0 2024-11-05 12:54
ChatGPT 幕后大佬、o1 推理模型作者 Luke Metz 官宣从 OpenAI 离职

就在刚刚，又一位元老级人物官宣离职OpenAI了。o1推理模型贡献者之一LukeMetz发文称，「我即将离开OpenAI，结束这段超过两年的奇妙旅程」。与此同时，Information爆料称，此前出走的后训练团队负责人BarretZoph，现有了新的继任者——William(Liam)Fedus。他也是o1模型的七大负责人之一。值得一提的是，今天的两位主角此前都曾是谷歌的研究员；在来到OpenAI

106 0 2024-10-10 13:15
o1 模型完整思维链成 OpenAI 头号禁忌，问多了等着封号吧

警告！不要在ChatGPT里问最新o1模型是怎么思考的——只要尝试几次，OpenAI就会发邮件威胁撤销你的使用资格。请停止此活动，确保您使用ChatGPT时符合我们的使用条款。违反此条款的行为可能导致失去OpenAIo1访问权限。大模型新范式o1横空出世不到24小时，就已经有不少用户反馈收到这封警告邮件，引起众人不满。有人反馈只要提示词里带“reasoningtrace”、“showyourcha

103 0 2024-09-14 12:51

Echo

Llama 版 o1 大模型发布：来自上海 AI Lab，强化学习代码已开源

ChatGPT 幕后大佬、o1 推理模型作者 Luke Metz 官宣从 OpenAI 离职

o1 模型完整思维链成 OpenAI 头号禁忌，问多了等着封号吧