您所在的位置:红商网 >> 天下汇频道 >> 正文
自建低成本生成式人工智能的热潮才刚刚开始

  斯坦福大学的研究人员最近发布了他们关于使用 “倒计时” 游戏来观察人工智能如何学习的预印本论文,并克服了之前阻碍他们进展的工程挑战。

  “TinyZero 很棒。” 该项目的首席研究员卡尼什克・甘地说,因为它使用了 “倒计时” 游戏,这是斯坦福团队引入并正在研究的一个任务。

  其他人工智能项目的开源也起到了重要作用,包括由 TikTok 的母公司字节跳动创建的火山引擎强化学习系统(VERL)。“VERL 对我们运行实验至关重要。” 甘地说。“这种一致性极大地帮助了我们进行实验,并实现了更快的迭代周期。”

  超越 “大实验室”,依靠开源

  斯坦福团队试图理解为什么一些大语言模型在推理能力上有显著提升,而另一些则停滞不前,甘地表示,他不再期望与推理、智能和改进相关的计算机科学突破必然来自大型实验室。“即使在大型实验室内部,对当前大语言模型的科学理解也存在缺失,因为其能力在不断提高。在自主开发人工智能、开源和学术界方面,有很大的空间可以在此做出贡献。” 他说。

  像斯坦福大学和加州大学伯克利分校的这些项目,将基于如何训练能够自我提高推理能力的模型的研究,带来更多的共享开发成果。

  但即使是这些超低成本的模型,也比研究人员所解释的要昂贵。

  人工智能商业咨询公司 OneSix 的高级首席机器学习科学家尼娜・辛格表示,TinyZero 这样的项目的开源方面依赖于在其他基础模型之上进行训练,其中不仅包括 VERL,还包括阿里云开源的通义千问(Qwen)大语言模型。“所说的 30 美元训练成本不包括通义千问最初的训练时间,阿里巴巴在将其作为开源权重发布之前,在这上面投入了数百万美元。” 她说。

  辛格表示,这并不是对 TinyZero 的批评,而是强调了开源权重模型的重要性 —— 即使没有完全开源人工智能数据和架构,这些模型也会向公众发布训练参数,从而推动进一步的研究和创新。

  “针对特定任务进行微调的较小人工智能模型,能够以更小的规模和成本与大得多的模型相媲美。” 辛格说。

  随着越来越多的个人、学者和小型公司期望在无需进行大规模基础设施投资的情况下就能参与到人工智能领域,尝试模仿基础模型的性能并针对特定任务进行微调的趋势正在增长。辛格举了 Sky-T1 的例子,它为用户提供了花费 450 美元训练自己的 o1 模型的能力,还有阿里巴巴的通义千问,最低只需 6 美元就能进行人工智能模型的微调。

  辛格预计,较小项目的开源权重模型将促使主要参与者采用更开放的方法。“自主微调以及社区驱动的模型改进的成功,给像 OpenAI 和 Anthropic 这样的公司带来了压力,要求它们为其受 API 限制的模型提供合理依据,尤其是当开源替代方案在特定领域开始达到或超过它们的能力时。” 她说。

  TinyZero 最重要的发现之一是,数据质量和针对特定任务的训练,比单纯的模型规模更重要。

  “这是一个重大发现,因为它挑战了行业中普遍存在的观点,即只有像 ChatGPT 或(Anthropic 的)Claude 这样拥有数千亿参数的大规模模型,才能够进行自我修正和迭代学习。” 辛格说。“这个项目表明,我们可能已经越过了一个临界点,即额外增加参数带来的收益在递减 —— 至少对于某些任务来说是这样。”

  这意味着人工智能领域的重点可能正在从模型规模转向效率、可及性和有针对性的智能。

  或者正如 TinyZero 团队在项目页面上自己所说:“你可以用不到 30 美元亲自体验‘顿悟’时刻。”

  来源:新浪财经 环球市场播报

2页 上一页  [1] [2] 

    东治书院2024级易学文士班(第二届)报名者必读
    『独贾参考』:独特视角,洞悉商业世相。
    【耕菑草堂】巴山杂花土蜂蜜,爱家人,送亲友,助养生
    解惑 | “格物致知”的“格”到底是什么意思?
    ❤❤❤【拙话】儒学之流变❤❤❤
    易经 | 艮卦究竟在讲什么?兼斥《翦商》之荒谬
    大风水,小风水,风水人
    ❤❤❤人的一生拜一位好老师太重要了❤❤❤
    如何成为一个受人尊敬的易学家?
    成功一定有道,跟着成功的人,学习成功之道。
    关注『书仙笙』:结茅深山读仙经,擅闯人间迷烟火。
    研究报告、榜单收录、高管收录、品牌收录、企业通稿、行业会务
    ★★★你有买点,我有流量,势必点石成金!★★★