OpenAI大重启:新模型想让你相信ChatGPT像人思考
原标题:OpenAI大重启:新模型想让你相信ChatGPT像人思考
导读:
不写平庸的故事能用钱解决的问题就不是大问题文魏霞编辑王芳洁结果不可避免月日下午点东方甄选股东沟通会上针对董宇辉离职一事俞敏洪说当然这话外界未必买账否则消息公布次日新东方和东方甄...
UT OF COMMON/不写平庸的故事/能用钱解决的问题,就不是大问题文/魏霞编辑/王芳洁结果不可避免。7月26日下午3点,东方甄选股东沟通会上,针对董宇辉离职一事,俞敏洪说。这话外界未必买账,否则消息公布次日,新东方和东方甄选不会双双大跌,其中东方甄选当日最大跌幅达到了28....
9月13日消息,经过数周的猜测与期待,OpenAI终于推出了其首个“推理模型”o1。这款产品被认为是该公司迄今最强大的人工智能产品之一,其 问题的能力表现出前所未有的类人思维特质。至少,这是该公司对外的宣传。
和OpenAI以往的研究和产品发布一样,o1目前仍有些“吊胃口”。OpenAI声称,这个模型在处理复杂任务时表现更加出色,但却几乎未透露模型训练的细节。目前,o1仅向付费Ch GPT用户和特定程序员提供有限预览。
OpenAI信心满满地表示,o1在物理、化学和生物等领域已经展示出类似博士生的思维深度。这一进展被认为如此重要,以至于OpenAI决定从现有的GPT-4重新开始,将模型的编号重置为“1”,甚至考虑舍弃已被广泛认可的“GPT”品牌。这一品牌不仅定义了其聊天机器人,还标志着整个生成式领域的腾飞。
OpenAI今天发布的研究报告和博客文章,展示了许多o1在应对复杂任务上的惊人能力。这些任务涵盖高等数学、编程难题、密码解密,甚至包括来自遗传学、经济学和量子物理学领域的专业问题。大量图表显示,o1在公司内部评估中,已显著超越了其顶尖的语言模型GPT-4o,在编程、数学及科学领域表现尤为突出。
这些进步的关键源自对儿童教育的深刻洞察——“三思而后行”。OpenAI称,OpenAI o1在作答前会花费更多时间进行“深思熟虑”,类似于人类的思考过程。公司将这一过程称为“思维链”,这是一个AI研究中的术语,指将问题分解为多个中间步骤的 策略。这个“思维链”机制使模型能够逐步 小任务、自我修正并优化 方案。当用户向o1提出问题时,模型会显示“思考中”,随后展示其推理过程中的一些步骤,如“追溯历史演变”或“整合证据片段”。最终,它会标注思考的时长,例如“思考9秒”,然后给出 。
尽管o1在生成 时的完整“思维链”对用户不可见,以简化用户体验,但这也牺牲了部分透明度,使得用户难以了解模型如何得出最终的。这同时也是为了保护模型的核心技术不被竞争对手掌握。关于o1的构建细节,OpenAI透露甚少,仅表示其训练基于“全新的优化算法和训练数据集”。
尽管OpenAI的营销力度空前,但o1是否会为Ch GPT带来革命性体验,或仅是对现有模型的渐进式改进,仍不确定。从公司展示的研究成果和我的初步 来看,o1的输出结果确实更为 且富有逻辑。这反映了OpenAI对规模效应的信心:更大的AI模型、更多的数据以及更强大的计算能力,将推动AI性能的飞跃。训练时间越长,o1的表现越出色。
长时间的思考也伴随着更高的成本。OpenAI允许程序员支付使用其技术,而o1的每个词输出费用大约是GPT-4o的四倍。生成式AI所需的高性能芯片、电力及冷却系统都极为昂贵。为了满足这些庞大的计算需求,科技公司、能源企业和其他行业预计将投入数万亿美元。这引发了人们的担忧:AI是否会像加密货币或互联网泡沫时代一样,成为新的泡沫。由于o1响应问题所需的时间更长,其消耗的资源也随之增加,这进一步加剧了AI技术何时能盈利的不确定性。
这延长的处理时间,最显著的影响或许并不是技术或财务方面的负担,而是对品牌的重塑。相比过去AI模型中那些晦涩的术语如“转换器”和“扩散”,OpenAI的“推理模型”以及“思维链”听起来更贴近日常语言,带有一种“人类化”的色彩。
这种语言策略并非OpenAI独有。初创公司Anthropic将其主打模型Claude形容为拥有“性格”和“头脑”,谷歌大肆宣传其AI的“推理”能力,AI搜索Perplexity则宣称其产品“理解你”。OpenAI的博客直接指出,o1“像人类一样思考”,“如同真正的软件工程师一般工作”,并且“具备类似人类的推理能力”。尽管研究负责人强调,OpenAI并不认为其产品等同于人类大脑,但他也承认,o1在某些方面确实比之前的模型显得更“人性化”。
对于一个产品定位尚不清晰的行业来说,“人性化”的表达方式无疑是一种有力的营销手段。智能的定义本来就模糊不清,而语言模型的实际价值也难以确切评估。“GPT”这个名称看似简单,却难以传达任何实际含义。尽管OpenAI的首席研究官鲍勃·麦克格罗(Bob McGrew)认为,OpenAI o1是迈向“更合理命名”的 步,旨在更清晰地表达其产品,但这些字母和数字组合的微妙差异对普通人来说往往无关紧要。
推销一种能够“像你一样思考”的工具,与科学实验室的术语完全不同,它更像是文学中的概念。这样的描述固然不比其他AI术语更精确,甚至可能更模糊,但也正因此赋予了其独特的魅力。一个声称“像人类思考”的AI模型,为人们留下了想象的空间,让每个用户都能填补其中的空白,构想出一台“像我一样运作”的机器。或许,销售生成式AI的关键就在于此——让客户自己去构筑和填补这其中的“魔法”。(小小)