OpenAI“草莓”值万亿吗？

09-13 957阅读 29评论

奥特曼和马保国有什么共同点？答：都爱搞狙击。

“草莓”的音讯现已传了几个月，听说这是OpenAI内部的一个奥秘项目，好像和前代模型颇有些不同。但OpenAI一贯讳莫如深，最接近曝光的时刻，是此前CEO山姆·奥特曼（Sam Altman）在交际媒体上发布的一张真·草莓相片。

就在前几天，The Information还在爆料称“草莓”将在未来两周内发布。

即便在如此高的重视度下，OpenAI仍是打了世界一个措手不及：当地时刻9月12日下午，没有任何预告，没有任何发布会，OpenAI忽然发布了新模型。

不过，新模型的姓名不像“草莓”那样甘旨，而是很正派，且饶有深意：o1。

要知道，此前OpenAI发模型一贯以“GPT”系列迭代，从2018年的GPT-1到本年5月的GPT-4o无不如是。现在，OpenAI却拓荒新条线。

在官宣o1发布的官方博文中，OpenAI这样说道：“作为前期模型，它还不具备使 ChatGPT 有用的许多功用……但关于杂乱的推理使命来说，这是一个严重前进，代表了 AI 才能的新水平。鉴于此，咱们将计数器重置回1并将此系列命名为 OpenAI o1。”

新模型现在只敞开给ChatGPT付费订阅用户和部分程序员，为表该模型还不老练，暂叫“o1-preview”，preview即为预览之意。此外，OpenAI还随手发了小模型版别o1-mini。不管是o1-preview仍是o1-mini，现在都有每周的回应条数约束。

奥特曼自己在交际媒体X上夸奖新模型是“咱们迄今为止最强壮、最共同的模型”之外，也着重“o1依然存在缺点，依然有限”。

一贯喜爱给ChatGPT泼冷水的AI学者盖里·马库斯（Gary Marcus）则戏谑OpenAI此举是“了解的配方”：发布演示demo、向有限的用户敞开、筹措资金、再来一遍。

o1发布的当下，OpenAI正在进行新一轮融资。依据彭博社最新音讯，本轮融资将是百亿美元规划、方针估值1500亿美元的大事件。

先来看看模型自身。

正如此前的风闻，o1的一大侧重点是“推理”。而“推理”的背面的要害，则是“考虑”。

关于用户来说，最直观的感触是o1-preview在答复问题之前，会花更长时刻。

字母榜在o1-preview模型下，向ChatGPT发问“今天是几月几号星期几”。问题发送后，ChatGPT逐个显现自己正在进行的考虑进程：答复日期问题、检查指引、了解其时日期，然后才给出答案，标明“考虑8秒”。

与之比较，在GPT-4o模型下，ChatGPT在3秒内直接给出答复，没有显现中心进程。

“这是一款经过强化学习练习的新式大预言模型，旨在履行杂乱的推理使命。o1在答复问题前会进行考虑——它能够在答复用户之前产生一个内部的长‘思想链’。”OpenAI在博文中写道。

这次o1模型发布，OpenAI官方关于技能细节泄漏得很少，反复着重的便是“思想链”。

据OpenAI解说，o1在测验解决问题时运用思想链，就像人类在答复一个困难问题之前长时刻地考虑。经过强化学习，o1学会了精细化其思想链并优化运用战略。它能够辨认和纠正自己的过错，学会将杂乱的进程分化得更简略。其时的办法不起作用时，它会测验不同的办法。

“这个进程极大地提高了模型的推理才能。”

那o1的才能终究有多强呢？除了OpenAI一连发布的数条演示视频之外，最有说服力的还得是测验成果。OpenAI表明，在许多推理密布的基准测验中，o1的体现“与人类专家相媲美”，优于曾经的技能。例如在世界奥数考试（IMO）中，曾经的技能得分13%，o1的得分高达83%。

在 Codeforces 编程竞赛中，o1拿到89%的优异成果。OpenAI根据o1还针对性地开发了更拿手编程的o1-ioi，成果一举超越93%的参赛者。

另一个被OpenAI特别拿出来“夸耀”的测验是GPQA-diamond，这是一个化学、物理学和生物学专业知识的基准测验。OpenAI邀请了具有博士学位的专家一起比拼，发现“o1的体现超越了这些人类专家”。

OpenAI还称，启用视觉感知才能后，o1在MMMU测验中的得分为78.2,%，“成为第一个能够与人类专家竞赛的模型”。此外，57个MMLU子类别中，o1在54个子类别上超越了GPT-4o。

总归，o1比起OpenAI之前的模型，更重视推理才能，在数学和编程等方面的才能特别得到提高，说夸大点儿简直是拳打博士，脚踢专家，并且经过“思想链”，还有望削减模型的错觉。

不过，现在o1还处在比较前期的阶段，正如奥特曼着重的“还有缺点，依然有限”。

仅在字母榜的浅浅测验中，o1-preview就产生过过错。如发问“9.11和9.9哪个大”，GPT-4o答复过错，o1-preview相同答复过错，一本正派地表明“9.11的确大于9.9.由于9.11（即9.11）比9.9（9.90）要大”。噜苏中带着一丝诙谐，更别提考虑花费了15秒。

The Information也报导称，一些试用了o1-preview的用户表明，许多互动“不值得额定等候10到20秒的时刻”，他们更喜爱GPT-4o的响应速度。

现在敞开给付费用户的是o1-preview和o1-mini，但次数有约束：o1-preview每周30条音讯，o1-mini每周50条音讯。

下周开端，ChatGPT的企业用户和教育（Edu）用户也能够拜访这两种模型。OpenAI还表明未来想向一切用户免费供给o1-mini，但详细的时刻并未发布。

这仍是OpenAI初次在发布模型的时分加上相似“preview（预览）”的后缀，此前不管是GPT-4仍是GPT-4o都是直接发布完整体。

o1的一个不容忽视的特点是：贵。

开发人员拜访o1的本钱十分高：在API方面，o1-preview每100万个输入令牌或模型解析的文本块收费15美元，是GPT-4o的三倍，每100万个输出令牌收费60美元，是GPT-4o的四倍。

The Atlantic在报导中剖析称，o1专门被规划成需求更多时刻的，这必然会耗费更多资源，添加AIGC盈余的难度。

本文最初说到的马库斯（Gary Marcus）是人类神经科学和人工智能穿插范畴的学者，纽约大学荣誉教授，一起也是AI草创公司Geometric Intelligence的创始人兼CEO，他愈加家喻户晓的人物是“AI界的刺儿头”，屡次批判OpenAI。

在他看来，OpenAI忽然发布o1-preview的行为更多是一种宣扬手法。

究竟OpenAI正在进行一轮重要的融资，据彭博社近来的最新报导，OpenAI正在商谈以1500亿美元估值从投资者那里筹措65亿美元，此外还想以循环信贷的方法从银行筹措50亿美元。

“发demo，向有限用户敞开、筹钱、重复”，马库斯这样总结OpenAI的“手法”。

本年7月，The Information曾报导OpenAI本年或许亏本高达50亿美元。其间OpenAI本年的职工本钱约15亿美元，AI练习和推理本钱或许高达70亿美元，而年收入则估计在35亿美元到45亿美元之间。

其时The Information就预言，照这个烧钱速度，OpenAI很快就得出来融资，上一次OpenAI的重要融资仍是2023年头，微软投了百亿美元。

OpenAI现已不是第一次在要害节点开释“不老练的产品”。

上一年10月，OpenAI传出寻求出售股票的音讯，其时被传的或许估值是860亿美元。可是次月OpenAI产生了惊人的高层剧变，奥特曼被踢出公司，又很快重回CEO岗位，赢得了“宫斗”。但股票出售方案由此被时间短耽误，直到11月底才有买卖“重回正轨”的音讯。彼时就有知情人士表明，职工忧虑这次突发事件会影响股票出售，影响公司的估值。

风趣的是，在本年2月15日，OpenAI忽然发布了一个全新的视频生成模型Sora，演示demo引起外界轰动。不出三日，《纽约时报》报导，OpenAI完结了职工出售股份的买卖，公司估值“按期”超越800亿美元。

现在现已过去了半年多，Sora迟迟未向群众敞开，乃至没有推动大规划的测验。外界开端置疑，Sora其实底子没有满足的算力支撑运转。商场研究机构Factorial Funds发布的陈述以为，布置Sora需求72万张英伟达H100芯片。

9月初，《台湾经济日报》报导台积电的A16埃米级芯片现已有大客户下单，除了苹果之外，还有OpenAI。而OpenAI将用定制芯片提高Sora的视频生成才能。这好像也印证着此前Sora遇到了算力卡点。

现在草莓味的ChatGPT来了，或许很快，咱们就能看到OpenAI成功完结新一轮融资、估值超万亿元的音讯。