您所在的位置:红商网 >> 天下汇频道 >> 正文
自建低成本生成式人工智能的热潮才刚刚开始

  据报道,OpenAI 正以 3000 亿美元的更高估值筹集更多资金,但对基于生成式人工智能热潮的大型科技股泡沫的担忧,已经削弱了市场领先企业的地位。

  中国的 DeepSeek 的出现是一个主要原因,现在,数十亿美元的人工智能数据中心建设正受到审视,阿里巴巴联合创始人蔡崇信最近也发出了警告。

  但在斯坦福大学和加州大学伯克利分校等顶尖学校的计算机科学家当中,仅需 30 美元就能构建一个大语言模型的能力,带来了 “顿悟” 时刻。

  当 DeepSeek 发布其 R1 模型,并声称仅花费 600 万美元就实现了其生成式人工智能大语言模型时,包括微软投资的 OpenAI 在内的美国人工智能市场领先企业所投入的数十亿美元资金,立即受到了审视。

  DeepSeek 的成本分析仍然受到怀疑,投资者对 OpenAI 的信心也并未减弱。据报道,它准备以高达 3000 亿美元的估值进行一轮 400 亿美元的融资,并表示今年的收入将增长两倍,达到 127 亿美元。热门人工智能芯片公司 CoreWeave 本周也希望重振不稳定的首次公开募股(IPO)市场,并开启人工智能股票发行热潮。但对人工智能市场是否发展过快、支出水平是否过高的担忧也并未停止。

  今年到目前为止,“七巨头” 科技股一直是市场表现最差的股票之一,就在本周,阿里巴巴联合创始人蔡崇信警告称,他看到了美国人工智能泡沫正在形成的迹象。随着对人工智能发展以及美国在人工智能竞赛中领先地位的预期不断调整,其影响已经广泛蔓延,从要求实施更严厉的芯片禁运以减缓中国的发展,到另一方面,风险投资家们向中国的人工智能开发者投入更多资金。

  但对于美国人工智能领域的一些人来说,一切仍在全速前进,因为生成式人工智能领域的廉价采购热潮,让研究人员能够以前所未有的方式推动大语言模型的构建能力,而在 DeepSeek 出现之前,他们似乎无法做到这一点。

  加州大学伯克利分校的研究人员是最早对 DeepSeek 进行小规模语言模型复现的团队之一,而且仅花费了 30 美元。这是在公共云上租用两块英伟达 H200 图形处理器(GPU),并使用一个简单游戏来训练 “30 亿参数”(3B)模型的费用 —— 这里的 “30 亿” 指的是模型中的参数数量,实际上比最复杂的大语言模型(其参数数量可达数万亿)要少得多。

  “在 DeepSeek R1 发布后,我们立即启动了这个项目。”TinyZero 项目负责人、该校研究生研究员潘佳怡说。

  OpenAI 的突破对该团队的研究兴趣同样至关重要,潘佳怡表示,他们对一种新的人工智能推理范式很着迷,这种范式 “旨在让人工智能在做出回应之前多花些时间思考”。

  但 DeepSeek R1 是首个有助于解释如何实现这种 “先思考再回答” 能力的公开研究,这种能力提高了人工智能模型的性能。“我们非常好奇这种算法是如何工作的。” 潘佳怡说。但潘佳怡补充道,即便 DeepSeek 据说只花了 600 万美元来训练其 R1 模型,这对他们来说 “还是太贵了”。

  TinyZero 项目背后的主要思路是,如果在减小模型规模的同时降低任务复杂度,模型仍然能够展现出涌现的推理行为。这些调整将大幅降低成本,同时仍能让研究人员测试和观察实际的推理行为。

  人工智能的 “顿悟” 时刻

  为了验证这一思路,该团队在一个名为 “倒计时”(Countdown)的数学游戏中复现了 DeepSeek R1-Zero 算法,这个游戏更注重推理能力,而不是基于已有的 “领域” 知识(即数学知识)来寻找解决方案。在这个游戏中,人工智能需要得出一个目标数字,可以通过加、减、乘或除来实现。

  起初,TinyZero 采用随机的方法来寻找目标数字;然而,经过训练,它开始学会调整方法,找到更好、更快的解决方案。而且,即使任务复杂度和模型规模都降低了,该模型仍然能够展现出涌现的推理行为。它通过在游戏的参数范围内学习玩这个游戏,学会了推理。

  “我们证明了,即使是像 30 亿参数这么小的模型,也能学会对简单问题进行推理,并开始学会自我验证和寻找更好的解决方案。” 潘佳怡说。她表示,这是 DeepSeek R1 和 OpenAI o1 发布成果中的一个关键结果,通常被称为 “顿悟时刻”。

  虽然最大的人工智能模型、DeepSeek 和 TinyZero 这样的项目之间存在显著差异,但涌现的推理行为是相似的,TinyZero 这样的成功案例表明,预算有限的研究人员、工程师和爱好者也能够接触到前沿的人工智能算法。

  “我们的项目吸引了很多人访问我们在 GitHub 上的页面,复现实验并亲自体验‘顿悟’时刻。” 潘佳怡说。

2页 [1] [2] 下一页 

    东治书院2024级易学文士班(第二届)报名者必读
    『独贾参考』:独特视角,洞悉商业世相。
    【耕菑草堂】巴山杂花土蜂蜜,爱家人,送亲友,助养生
    解惑 | “格物致知”的“格”到底是什么意思?
    ❤❤❤【拙话】儒学之流变❤❤❤
    易经 | 艮卦究竟在讲什么?兼斥《翦商》之荒谬
    大风水,小风水,风水人
    ❤❤❤人的一生拜一位好老师太重要了❤❤❤
    如何成为一个受人尊敬的易学家?
    成功一定有道,跟着成功的人,学习成功之道。
    关注『书仙笙』:结茅深山读仙经,擅闯人间迷烟火。
    研究报告、榜单收录、高管收录、品牌收录、企业通稿、行业会务
    ★★★你有买点,我有流量,势必点石成金!★★★