
在英伟达GTC大会的主题演讲中,CEO黄仁勋表示,AI Token正在成为一种新的货币形式,将在人才招聘、预算制定和生产力提升方面发挥重要作用。大会于周四在加利福尼亚州圣何塞举行。
黄仁勋指出,AI Token也将越来越多地影响公司的发展进程和盈利能力。"Token是新的商品",他说道,随后补充:"计算过去是基于检索的,现在是生成式的。"
Token是现代AI计算的核心,就像比特曾经是基于CPU的传统计算的单位一样。AI正被集成到大多数新的软件产品中。
"这个概念......将结构化数据与生成式AI融合,将在一个又一个行业中重复出现",黄仁勋说道。
Token也正在成为AI实施推动公司收入增长的基本组成部分。"如果他们能获得更多容量,就能生成更多Token,收入就会增加",黄仁勋表示。
云服务提供商提供基于AI Token收费的定价方案,特别是对于基于文本的模型。基于视频的模型通常不是基于Token定价,而是按任务或基于GPU使用时间定价。
黄仁勋表示,他可以设想Token将作为开发人员的福利提供,开发人员需要这些单位来提高生产力。"我完全可以想象,在未来,我们公司的每一位工程师都需要年度Token预算",黄仁勋说道。
工程师的基础工资将是每年几十万美元,"我将在此基础上再给他们大约一半的Token,这样他们的生产力可以提升10倍",黄仁勋表示。
工作中包含多少Token已经成为硅谷的招聘工具。"原因很明确——因为每个有Token访问权限的工程师都会更有生产力",黄仁勋说道。
对Token的需求前所未有,这使价格保持在高位。但随着新技术的推广,成本应该开始趋于稳定或下降。
在GTC大会上,黄仁勋推出了一系列新技术,包括名为Rubin的新GPU和名为Vera的CPU。英伟达将它们与Groq的新推理芯片融合在一起。
"我们将把Token生成率从2200万提高到7亿——增长350倍",黄仁勋说道。
这些芯片适用于英伟达所称的AI工厂,生成Token来帮助公司实施AI计划。"AI工厂的收入等于每瓦Token数。在功耗限制下,每个未使用的瓦特都是收入损失",黄仁勋表示。
到目前为止,在GTC大会上,英伟达的大部分Token信息都围绕推理而非训练展开,但推理不会涉及"巨额"的Token成本,J. Gold Associates首席分析师Jack Gold表示。
英伟达声称Vera Rubin将在系统价格上升的同时降低计算成本,但这一说法并不像表面上看起来那么简单,Gold说道。
英伟达在训练方面已经确立了地位,这为推理作为芯片制造商的关键增长领域留下了空间。在推理中生成Token的成本预计会更低。
"推理对成本敏感,就像云托管一样",Gold说道。"即使系统昂贵,我们可以让你生成更多Token——从而获得更多收入......这对他们未来发展来说是一个关键信息。"
除了数据中心,英伟达也在将Token生成带到本地部署。这一举措与AI PC的发布相吻合,比如戴尔的Pro Max GB300,它使用英伟达的数据中心GPU,使其成为迄今为止最强大的AI PC。
"客户现在真正意识到了云中Token的成本。他们现在正在寻找更具成本效益的选择来投资基础设施,包括本地部署",戴尔产品负责人Charlie Walker在简报中说道。
黄仁勋在演讲中还重点介绍了OpenClaw——构建AI智能体的开放框架,并推出了基于该技术的英伟达企业级平台NemoClaw。
OpenClaw帮助AI智能体交互和协调任务,这可以实现长期运行的工作流程。这可以生成大量Token。
"OpenClaw事件的重要性不容低估。这与HTML一样重要。这与Linux一样重要。我们现在有了一个世界级的开放智能体框架,我们所有人都可以用它来构建我们的OpenClaw策略",黄仁勋说道。
Q&A
Q1:什么是AI Token经济学?它如何影响企业发展?
A:AI Token经济学是指将Token作为一种新的货币形式,在人才招聘、预算制定和生产力提升方面发挥作用。Token正在成为推动公司收入增长的基本组成部分,拥有更多Token容量的企业能够生成更多收入。
Q2:为什么Token会成为招聘工具?
A:在硅谷,工作中包含的Token数量已经成为招聘工具,因为每个有Token访问权限的工程师都会更有生产力。黄仁勋预测未来每位工程师都需要年度Token预算,Token可以让他们的生产力提升10倍。
Q3:英伟达如何降低Token生成成本?
A:英伟达推出了名为Rubin的新GPU和名为Vera的CPU,并与Groq的推理芯片融合,将Token生成率从2200万提高到7亿,增长350倍。同时推出AI工厂概念,通过提高每瓦Token数来优化收入效率。