OpenAI“草莓”值万亿吗?

09-13 957阅读 29评论

OpenAI“草莓”值万亿吗?

奥特曼和马保国有什么共同点?答:都爱搞狙击。

“草莓”的音讯现已传了几个月,听说这是OpenAI内部的一个奥秘项目,好像和前代模型颇有些不同。但OpenAI一贯讳莫如深,最接近曝光的时刻,是此前CEO山姆·奥特曼(Sam Altman)在交际媒体上发布的一张真·草莓相片。

OpenAI“草莓”值万亿吗?

就在前几天,The Information还在爆料称“草莓”将在未来两周内发布。

即便在如此高的重视度下,OpenAI仍是打了世界一个措手不及:当地时刻9月12日下午,没有任何预告,没有任何发布会,OpenAI忽然发布了新模型。

不过,新模型的姓名不像“草莓”那样甘旨,而是很正派,且饶有深意:o1。

OpenAI“草莓”值万亿吗?

要知道,此前OpenAI发模型一贯以“GPT”系列迭代,从2018年的GPT-1到本年5月的GPT-4o无不如是。现在,OpenAI却拓荒新条线。

在官宣o1发布的官方博文中,OpenAI这样说道:“作为前期模型,它还不具备使 ChatGPT 有用的许多功用……但关于杂乱的推理使命来说,这是一个严重前进,代表了 AI 才能的新水平。鉴于此,咱们将计数器重置回1并将此系列命名为 OpenAI o1。”

新模型现在只敞开给ChatGPT付费订阅用户和部分程序员,为表该模型还不老练,暂叫“o1-preview”,preview即为预览之意。此外,OpenAI还随手发了小模型版别o1-mini。不管是o1-preview仍是o1-mini,现在都有每周的回应条数约束。

奥特曼自己在交际媒体X上夸奖新模型是“咱们迄今为止最强壮、最共同的模型”之外,也着重“o1依然存在缺点,依然有限”。

OpenAI“草莓”值万亿吗?

一贯喜爱给ChatGPT泼冷水的AI学者盖里·马库斯(Gary Marcus)则戏谑OpenAI此举是“了解的配方”:发布演示demo、向有限的用户敞开、筹措资金、再来一遍。

OpenAI“草莓”值万亿吗?

o1发布的当下,OpenAI正在进行新一轮融资。依据彭博社最新音讯,本轮融资将是百亿美元规划、方针估值1500亿美元的大事件。

A

先来看看模型自身。

正如此前的风闻,o1的一大侧重点是“推理”。而“推理”的背面的要害,则是“考虑”。

关于用户来说,最直观的感触是o1-preview在答复问题之前,会花更长时刻。

字母榜在o1-preview模型下,向ChatGPT发问“今天是几月几号星期几”。问题发送后,ChatGPT逐个显现自己正在进行的考虑进程:答复日期问题、检查指引、了解其时日期,然后才给出答案,标明“考虑8秒”。

OpenAI“草莓”值万亿吗?

与之比较,在GPT-4o模型下,ChatGPT在3秒内直接给出答复,没有显现中心进程。

“这是一款经过强化学习练习的新式大预言模型,旨在履行杂乱的推理使命。o1在答复问题前会进行考虑——它能够在答复用户之前产生一个内部的长‘思想链’。”OpenAI在博文中写道。

这次o1模型发布,OpenAI官方关于技能细节泄漏得很少,反复着重的便是“思想链”。

据OpenAI解说,o1在测验解决问题时运用思想链,就像人类在答复一个困难问题之前长时刻地考虑。经过强化学习,o1学会了精细化其思想链并优化运用战略。它能够辨认和纠正自己的过错,学会将杂乱的进程分化得更简略。其时的办法不起作用时,它会测验不同的办法。

“这个进程极大地提高了模型的推理才能。”

那o1的才能终究有多强呢?除了OpenAI一连发布的数条演示视频之外,最有说服力的还得是测验成果。OpenAI表明,在许多推理密布的基准测验中,o1的体现“与人类专家相媲美”,优于曾经的技能。例如在世界奥数考试(IMO)中,曾经的技能得分13%,o1的得分高达83%。

在 Codeforces 编程竞赛中,o1拿到89%的优异成果。OpenAI根据o1还针对性地开发了更拿手编程的o1-ioi,成果一举超越93%的参赛者。

另一个被OpenAI特别拿出来“夸耀”的测验是GPQA-diamond,这是一个化学、物理学和生物学专业知识的基准测验。OpenAI邀请了具有博士学位的专家一起比拼,发现“o1的体现超越了这些人类专家”。

OpenAI还称,启用视觉感知才能后,o1在MMMU测验中的得分为78.2,%,“成为第一个能够与人类专家竞赛的模型”。此外,57个MMLU子类别中,o1在54个子类别上超越了GPT-4o。

OpenAI“草莓”值万亿吗?

总归,o1比起OpenAI之前的模型,更重视推理才能,在数学和编程等方面的才能特别得到提高,说夸大点儿简直是拳打博士,脚踢专家,并且经过“思想链”,还有望削减模型的错觉。

B

不过,现在o1还处在比较前期的阶段,正如奥特曼着重的“还有缺点,依然有限”。

仅在字母榜的浅浅测验中,o1-preview就产生过过错。如发问“9.11和9.9哪个大”,GPT-4o答复过错,o1-preview相同答复过错,一本正派地表明“9.11的确大于9.9.由于9.11(即9.11)比9.9(9.90)要大”。噜苏中带着一丝诙谐,更别提考虑花费了15秒。

OpenAI“草莓”值万亿吗?

The Information也报导称,一些试用了o1-preview的用户表明,许多互动“不值得额定等候10到20秒的时刻”,他们更喜爱GPT-4o的响应速度。

现在敞开给付费用户的是o1-preview和o1-mini,但次数有约束:o1-preview每周30条音讯,o1-mini每周50条音讯。

下周开端,ChatGPT的企业用户和教育(Edu)用户也能够拜访这两种模型。OpenAI还表明未来想向一切用户免费供给o1-mini,但详细的时刻并未发布。

这仍是OpenAI初次在发布模型的时分加上相似“preview(预览)”的后缀,此前不管是GPT-4仍是GPT-4o都是直接发布完整体。

o1的一个不容忽视的特点是:贵。

开发人员拜访o1的本钱十分高:在API方面,o1-preview每100万个输入令牌或模型解析的文本块收费15美元,是GPT-4o的三倍,每100万个输出令牌收费60美元,是GPT-4o的四倍。

The Atlantic在报导中剖析称,o1专门被规划成需求更多时刻的,这必然会耗费更多资源,添加AIGC盈余的难度。

C

本文最初说到的马库斯(Gary Marcus)是人类神经科学和人工智能穿插范畴的学者,纽约大学荣誉教授,一起也是AI草创公司Geometric Intelligence的创始人兼CEO,他愈加家喻户晓的人物是“AI界的刺儿头”,屡次批判OpenAI。

在他看来,OpenAI忽然发布o1-preview的行为更多是一种宣扬手法。

究竟OpenAI正在进行一轮重要的融资,据彭博社近来的最新报导,OpenAI正在商谈以1500亿美元估值从投资者那里筹措65亿美元,此外还想以循环信贷的方法从银行筹措50亿美元。

“发demo,向有限用户敞开、筹钱、重复”,马库斯这样总结OpenAI的“手法”。

本年7月,The Information曾报导OpenAI本年或许亏本高达50亿美元。其间OpenAI本年的职工本钱约15亿美元,AI练习和推理本钱或许高达70亿美元,而年收入则估计在35亿美元到45亿美元之间。

其时The Information就预言,照这个烧钱速度,OpenAI很快就得出来融资,上一次OpenAI的重要融资仍是2023年头,微软投了百亿美元。

OpenAI“草莓”值万亿吗?

OpenAI现已不是第一次在要害节点开释“不老练的产品”。

上一年10月,OpenAI传出寻求出售股票的音讯,其时被传的或许估值是860亿美元。可是次月OpenAI产生了惊人的高层剧变,奥特曼被踢出公司,又很快重回CEO岗位,赢得了“宫斗”。但股票出售方案由此被时间短耽误,直到11月底才有买卖“重回正轨”的音讯。彼时就有知情人士表明,职工忧虑这次突发事件会影响股票出售,影响公司的估值。

风趣的是,在本年2月15日,OpenAI忽然发布了一个全新的视频生成模型Sora,演示demo引起外界轰动。不出三日,《纽约时报》报导,OpenAI完结了职工出售股份的买卖,公司估值“按期”超越800亿美元。

现在现已过去了半年多,Sora迟迟未向群众敞开,乃至没有推动大规划的测验。外界开端置疑,Sora其实底子没有满足的算力支撑运转。商场研究机构Factorial Funds发布的陈述以为,布置Sora需求72万张英伟达H100芯片。

9月初,《台湾经济日报》报导台积电的A16埃米级芯片现已有大客户下单,除了苹果之外,还有OpenAI。而OpenAI将用定制芯片提高Sora的视频生成才能。这好像也印证着此前Sora遇到了算力卡点。

现在草莓味的ChatGPT来了,或许很快,咱们就能看到OpenAI成功完结新一轮融资、估值超万亿元的音讯。

文章版权声明:除非注明,否则均为ZBLOG原创文章,转载或复制请以超链接形式并注明出处。

发表评论

快捷回复: 表情:
评论列表 (有 29 条评论,957人围观)
网友昵称:风の鍚
风の鍚 V 游客 沙发
后,o1在MMMU测验中的得分为78.2,%,“成为第一个能够与人类专家竞赛的模型”。此外,57个MMLU子类别中,o1在54个子类别上超越了GPT-4o。总归,o1比起OpenAI之前的模型,更
09-13 回复
网友昵称:夏雨的滴答
夏雨的滴答 V 游客 椅子
资者那里筹措65亿美元,此外还想以循环信贷的方法从银行筹措50亿美元。“发demo,向有限用户敞开、筹钱、重复”,马库斯这样总结OpenAI的“手法”。本年7月,The Information曾报导OpenAI本年或许亏本高达50亿美元。其间OpenAI本年的职工本钱约15亿美元,A
09-13 回复
网友昵称:谈昱文
谈昱文 V 游客 板凳
。一贯喜爱给ChatGPT泼冷水的AI学者盖里·马库斯(Gary Marcus)则戏谑OpenAI此举是“了解的配方”:发布演示demo、向有限的用户敞开、筹措资金、再来一遍。o1发布的当下,OpenAI正在进行新一轮融资。
09-13 回复
网友昵称:你们团我去送
你们团我去送 V 游客 凉席
AI在博文中写道。这次o1模型发布,OpenAI官方关于技能细节泄漏得很少,反复着重的便是“思想链”。据OpenAI解说,o1在测验解决问题时运用思想链,就像人类在答复一个困难问题之前长时刻
09-13 回复
网友昵称:缘戏今生
缘戏今生 V 游客 地板
(即9.11)比9.9(9.90)要大”。噜苏中带着一丝诙谐,更别提考虑花费了15秒。The Information也报导称,一些试用了o1-preview的用户表
09-13 回复
网友昵称:↘星辰变
↘星辰变 V 游客 6楼
剧变,奥特曼被踢出公司,又很快重回CEO岗位,赢得了“宫斗”。但股票出售方案由此被时间短耽误,直到11月底才有买卖“重回正轨”的音讯。彼时就有知情人士表明,职工忧虑这次突发事
09-14 回复
网友昵称:锦鹏
锦鹏 V 游客 7楼
学习,o1学会了精细化其思想链并优化运用战略。它能够辨认和纠正自己的过错,学会将杂乱的进程分化得更简略。其时的办法不起作用时,它会测验不同的办法。“这个进程极大地提高了模型的推理才能。”那o1的才能终究有多强呢?除了OpenA
09-14 回复
网友昵称:沉星
沉星 V 游客 8楼
望削减模型的错觉。B不过,现在o1还处在比较前期的阶段,正如奥特曼着重的“还有缺点,依然有限”。仅在字母榜的浅浅测验中,o1-preview就产生过过错。如发问“9.11和9.9哪个大”,GPT-4o答复过错,o1-preview相同答复过错,一本正派地表明“
09-14 回复
网友昵称:单身⒈人
单身⒈人 V 游客 9楼
个显现自己正在进行的考虑进程:答复日期问题、检查指引、了解其时日期,然后才给出答案,标明“考虑8秒”。与之比较,在GPT-4o模型下,ChatGPT在3秒内直接给出答复,没有显现中心进程。“这是一款经过强化学习练习的新式大预言模型,旨在履行杂
09-14 回复
网友昵称:披萨心肠
披萨心肠 V 游客 10楼
-4o都是直接发布完整体。o1的一个不容忽视的特点是:贵。开发人员拜访o1的本钱十分高:在API方面,o1-preview每100万个输入令牌或模型解析的文本块收费15美
09-13 回复
网友昵称:床单乄
床单乄 V 游客 11楼
-4仍是GPT-4o都是直接发布完整体。o1的一个不容忽视的特点是:贵。开发人员拜访o1的本钱十分高:在API方面,o1-preview每100万个输入令牌或模型解析的文本块收
09-14 回复
网友昵称:巷雨梨花
巷雨梨花 V 游客 12楼
cus)则戏谑OpenAI此举是“了解的配方”:发布演示demo、向有限的用户敞开、筹措资金、再来一遍。o1发布的当下,OpenAI正在进行新一轮融资。依据彭博社最新音讯,本轮融资将是百亿美元规划、方针估值1500亿美元的大事件。A先来
09-14 回复
网友昵称:月小觞
月小觞 V 游客 13楼
3秒内直接给出答复,没有显现中心进程。“这是一款经过强化学习练习的新式大预言模型,旨在履行杂乱的推理使命。o1在答复问题前会进行考虑——它能够在答复用户之前产生一个内部的长‘思想链’。”OpenAI在博文中写道。这次o1模型发布,OpenAI官方关于技能细节泄漏得很少,反复着重的便是“思想链”。据
09-13 回复
网友昵称:星河烂漫
星河烂漫 V 游客 14楼
程。“这是一款经过强化学习练习的新式大预言模型,旨在履行杂乱的推理使命。o1在答复问题前会进行考虑——它能够在答复用户之前产生一个内部的长‘思想链’。”OpenAI在博文中写道。这次o1模型发布,OpenAI官方
09-13 回复
网友昵称:合星汉
合星汉 V 游客 15楼
代表了 AI 才能的新水平。鉴于此,咱们将计数器重置回1并将此系列命名为 OpenAI o1。”新模型现在只敞开给ChatGPT付费订阅用户和部分程序员,为表该模型还不老练,暂叫“o1-preview”,preview即为预览之意。此外,OpenAI还随手发了小模型版别o1-mini。不管
09-14 回复
网友昵称:田昭娥
田昭娥 V 游客 16楼
ic Intelligence的创始人兼CEO,他愈加家喻户晓的人物是“AI界的刺儿头”,屡次批判OpenAI。在他看来,OpenAI忽然发布o1-preview的行为更多是一种宣扬手法。究竟OpenAI正在进行一轮重要的融资,据彭博社近来的最新报导,OpenAI正在商谈以1500亿美元估值从投资者
09-14 回复
网友昵称:升龙观
升龙观 V 游客 17楼
mation曾报导OpenAI本年或许亏本高达50亿美元。其间OpenAI本年的职工本钱约15亿美元,AI练习和推理本钱或许高达70亿美元,而年收入则估计在35亿美
09-13 回复
网友昵称:染墨香
染墨香 V 游客 18楼
模型一贯以“GPT”系列迭代,从2018年的GPT-1到本年5月的GPT-4o无不如是。现在,OpenAI却拓荒新条线。在官宣o1发布的官方博文中,OpenAI这样说道:“作为前期模型,它还不具备使 ChatGPT 有用的许多功用……但关于杂乱的推理使命来说,这是一个严重前进,代表了 AI 才能
09-13 回复
网友昵称:佯裝
佯裝 V 游客 19楼
外,还有OpenAI。而OpenAI将用定制芯片提高Sora的视频生成才能。这好像也印证着此前Sora遇到了算力卡点。现在草莓味的ChatGPT来了,或许很快,咱们就能看到OpenAI成功完结新一轮融资、估值超万亿元的音讯。
09-13 回复
网友昵称:痛不欲生的念
痛不欲生的念 V 游客 20楼
示demo、向有限的用户敞开、筹措资金、再来一遍。o1发布的当下,OpenAI正在进行新一轮融资。依据彭博社最新音讯,本轮融资将是百亿美元规划、方针估值1500亿美元的大事件。A先来看看模型自身。正如此前的风闻,o1的一大侧重点是“推理”。而“推理”的背面的要害,则是“考虑”。关于用户来说,最
09-14 回复
网友昵称:芒果姑娘
芒果姑娘 V 游客 21楼
之前长时刻地考虑。经过强化学习,o1学会了精细化其思想链并优化运用战略。它能够辨认和纠正自己的过错,学会将杂乱的进程分化得更简略。其时的办法不起作用时,它会测验不同
09-14 回复
网友昵称:巴
V 游客 22楼
奥特曼和马保国有什么共同点?答:都爱搞狙击。“草莓”的音讯现已传了几个月,听说这是OpenAI内部的一个奥秘项目,好像和前代模型颇有些不同。但OpenAI一贯讳莫如深,最接近曝光的时刻,是此前CEO山姆·奥特曼(Sam Altman)在交际媒体上发布
09-14 回复
网友昵称:孤祭
孤祭 V 游客 23楼
美元。现在现已过去了半年多,Sora迟迟未向群众敞开,乃至没有推动大规划的测验。外界开端置疑,Sora其实底子没有满足的算力支撑运转。商场研究机构Factorial Funds发布的陈述以为,布置Sora需求72万张英伟达H100芯片。9月初,《台湾
09-13 回复
网友昵称:陪衬
陪衬 V 游客 24楼
给o1-mini,但详细的时刻并未发布。这仍是OpenAI初次在发布模型的时分加上相似“preview(预览)”的后缀,此前不管是GPT-4仍是GPT-4o都是直接发布完整体。o1的一个不容忽视的特点是:贵。开发人员拜访o
09-13 回复
网友昵称:▔空寂
▔空寂 V 游客 25楼
学位的专家一起比拼,发现“o1的体现超越了这些人类专家”。OpenAI还称,启用视觉感知才能后,o1在MMMU测验中的得分为78.2,%,“成为第一个能够与人类专家竞赛的模型”。此
09-13 回复
网友昵称:默爱
默爱 V 游客 26楼
ini,但详细的时刻并未发布。这仍是OpenAI初次在发布模型的时分加上相似“preview(预览)”的后缀,此前不管是GPT-4仍是GPT-4o都是直接发布完整体。o1的一个不
09-14 回复
网友昵称:怀春少女
怀春少女 V 游客 27楼
9.11的确大于9.9.由于9.11(即9.11)比9.9(9.90)要大”。噜苏中带着一丝诙谐,更别提考虑花费了15秒。The Information也报导称,一些试用了o1-preview的用户表明,许多互动“不值得额定等候10到20秒的时刻”,他们更喜爱GPT-4o的响应速度。现在敞开给付费用
09-14 回复
网友昵称:小情調〆
小情調〆 V 游客 28楼
”超越800亿美元。现在现已过去了半年多,Sora迟迟未向群众敞开,乃至没有推动大规划的测验。外界开端置疑,Sora其实底子没有满足的算力支撑运转。商场研究机构Factorial Funds发布的陈述以为,布置Sora需求72万张英伟达H100芯片。9月初,《台湾经济日报》报导台积
09-14 回复
网友昵称:楠橙
楠橙 V 游客 29楼
iew”,preview即为预览之意。此外,OpenAI还随手发了小模型版别o1-mini。不管是o1-preview仍是o1-mini,现在都有每周的回应条数约束。奥特曼自己在交际媒体X上夸奖新模型是“咱们迄今为止最强壮、最共同的模型”之外,也着重“o1依然存在缺
09-13 回复