近几年来,AI技术的发展可谓是世事如棋局局新,而胜出者一定是掌握了其发展趋势,从而洞察先机,快人一步的企业。作为大数据时代的骄子,Cloudera在AI时代同样收获了发展良机,悄然跃升进了10亿美元营收的榜单之内。新春之际,作为一名深耕行业多年的从业者,Cloudera大中华区技术总监刘隶放谈了他眼中的2026年AI发展格局,为我们洞察2026年的AI市场先机提供了新的参照系。
Cloudera大中华区技术总监刘隶放
从可控、标准化到私有化
经历了2025年AI单点应用的普及之后,刘隶放认为,2026年企业级AI应用将经历一场始于产业化的变革,可信、可治理的私有AI将成为企业的关键差异化能力。也正是因为这种能力的需要,本地化私有部署将成为中国企业AI规模化落地的基础架构。
进入2026年,越来越多的企业开始了跨部门的AI应用整合。这也就意味着AI由原来的辅助工具,开始了向企业核心系统的渗透。由于AI技术在决策、质检、办公等领域的长项,AI将很快变成为企业核心系统。
因此,AI应用必然会向流程优化、运营自动化和行业级智能应用方向上转化。在制造、金融、电信等领域,众多企业已经印证了这一点。这些企业将更倾向于复用已验证的AI能力,并通过智能体工作流将AI深度嵌入核心业务流程,而不再局限于单一模型或实验项目。ROI、业务效率提升和可持续运营能力,将取代模型参数与算力规模,成为衡量AI成功与否的关键指标。
而随着AI被视为重要的“新型生产力”,企业和行业客户将更加重视AI系统的稳定性、连续性与可运营性。这样,可信、可治理的私有AI就将会顺势成为企业的关键差异化能力。在中国市场,数据安全与合规可控始终是AI应用的前提条件。
因此,刘隶放认为,越来越多的国内企业会在2026年转向私有 AI路径。也就是在受治理的环境中部署和运行模型;还会坚持数据不出域,权限可控、流程可追溯;此外也会通过检索增强生成(RAG)等方式,为模型提供业务上下文,同时保持数据可控。
在中国市场,2026 年企业对 AI 与数据架构的判断将进一步趋于清晰:本地化私有部署是 AI 规模化落地的基础前提。因此,本地化私有部署将成为 AI 规模化落地的基础前提。而为了做好这个前提,企业会让AI 是否能够在本地私有环境中持续运行、不断优化,并稳定支撑核心业务。一次性部署或短期验证已无法满足需求,取而代之的是对平台级能力的要求。
事实上,Cloudera早就针对预测到的发展趋势进行了布局,从关键收购到产品升级,从聚焦客户需求到推动行业标准化,Cloudera的AI布局始终围绕“产业落地”和“长期可控”。其中一个举动,就是收购了Taikun。借助Taikun技术,Cloudera获得了一个集成的计算层,可统一IT堆栈的部署与运维,在各类环境中提供类似云的一致体验。
刘隶放介绍说:“我们收购的核心目的,是为了搭建一个长期可控的环境,保障企业AI的私有化部署需求。Taikun被收购后,全面聚焦于Cloudera的平台进行研发。接下来Data Service 2.0的第一个AI版本,加入了Kubernetes平台承接,可以为企业提供更完善的AI服务支撑。”
而对于企业级AI市场,刘隶放强调:“企业关注的点和个人完全不同。对企业来说,AI必须是产业化的,他们更关心投入产出比,而不是单纯的技术炫技。例如针对金融行业用户,我们就必须保障他们的AI系统不能是‘空中楼阁’,而是要融入已有的系统,实现流程优化和数据结合。还要利用MCP帮他们打通AI与现有数据库和系统的对接,而非重构系统、造成资源浪费。而对于我们的新能源车产业用户,我们会更多地强调AI模型和平台能带来什么样的实际收益。”
AI整合的基础:数据整合
2026年,更多企业开始针对单点AI应用进行跨部门整合。表面看来,这是一场应用的整合,但其背后,要打破的不仅是流程壁垒,更是数据壁垒,所以企业首先要做好“内功”——在要求跨部门协同之前,先把自己的数据基础打牢。
在CIO时代的调研中,高质量数据的缺失,一直严重困扰着企业AI+的进程。而AI应用跨部门整合对数据提出更高要求时,企业更会面临一场严峻的考验。
对于这场考验,刘隶放认为企业的CIO们需要把握好三个核心关键点:明确数据溯源和数据分布、积极参与和践行标准化协议、推行数据湖仓一体架构,实现一致的数据管理。
具体来说,首先,明确数据溯源和数据分布,让数据血缘追溯更可视化。为此,Cloudera一直在深耕共享数据体验(SDX),2025年还收购了专门做数据血缘分析的Octopai公司,收购后快速与Cloudera的产品结合,就是为了增强数据可视化能力,让企业清楚数据从哪来、到哪去,为跨部门AI整合奠定基础。
其次,积极参与和践行标准化协议,比如模型上下文协议(MCP)。而作为开源领域的参与者和贡献者,Cloudera一直在MCP领域深耕,因为在智能体和模型调度中,需要一个统一的协议,才能实现不同组件、不同模型的对接。尤其是当AI需要访问真实数据、下探到数据库时,MCP的作用会非常关键,能避免出现“各自为战”的情况。
最后,要推行数据湖仓一体架构,实现唯一数据管理。以前很多企业会分开使用数据仓库和数据湖,比如银行用数据仓库做正式报告,用数据湖做内部分析,但这样很容易出现“两套数据、两个结果”的问题,跨部门整合时会产生很大风险——AI从不同平台拿数据,还要做比对,效率低且易出错。
现在随着Iceberg等组件的成熟,Cloudera可以把数据库纳入数据湖体系,打造数据湖仓一体架构,实现数据的唯一性管理。在此基础上,再讲数据血缘、跨部门协同,数据的公平性、正确性才能得到保障,AI跨部门整合的风险也会大幅降低。简单说,跨部门AI整合的前提,是“数据可信、数据唯一”,这也是Cloudera一直强调的核心。
刘隶放的介绍并没有停留在理论层面,在上汽大众车辆数据实时监测项目中,就利用现代化大数据平台助力解决海量数据激增难题。HBase存储空间相庆减少了约73TB,节约了67%的使⽤空间。总集群⽂件数减少约8千万,约优化原有⽂件数的75%。在核⼼报表及跑批业务上也实现了明显的性能提升,批量作业性能平均提升2.5倍,最⾼可达6.6倍。
打破AI人才瓶颈的法门
在CIO时代针对CIO人群的多次大规模调研中,AI人才瓶颈一直是CIO人群挥之不去的阴影。而当AI应用走上大规模落地之后,这同样是一个必须解开的难题。
对此,刘隶放表示:“现在行业竞争激烈,人员流动很频繁,我们不能把‘人员稳定性’当做管理指标,反而要把‘系统稳定性’放在核心位置——毕竟,很难保证一个人能在一家企业工作一辈子,但企业的AI平台需要长期稳定运行。“
因此,从工具角度来说,关键在于搭建一个松耦合的架构,不管是硬件体系、软件平台,还是人的技能适配,松耦合才能实现长期发展。举个例子,如果一个技术专家做了一个很好的AI应用,但这个人离职后,接手的人看不懂、不会运维,只能从头再来,这对企业来说是不可接受的。而松耦合架构能拆分工作细节,比如专家制定训练方法,外包人员提供符合质量要求的数据,即便有人离职,后续人员也能按照既定框架、注释和流程,快速接手工作,复制之前的成果,降低运营成本。
另外,刘隶放强调:“我认为企业要‘先找架构,再找人’。比如我们最近赢的新能源车和电池客户,他们选择我们,就是因为不相信“单一版本的专属解决方案”——毕竟乙方的人才也会流动,无法保证下一个版本能复制之前的效果。所以他们更倾向于把后端从通用模型调整到专有模型的全流程,掌握在自己手里,哪怕前期投入一些成本搭建框架,后续复制的成本会低很多,也不会依赖某个特定的人。“
除此之外,刘隶放表示,人才培养也很重要。很多长期做脚本开发、C语言、Java的从业人员,转到Python其实很快,只要给他们明确定位,他们就能用Python完成特定工作。反而那些懂大语言模型基本常识、知道如何部署、调试、配置的人,更稀缺,企业可以重点培养这类人才。如果企业人才储备不足,做不了模型微调,起码要搭建RAG体系,把自己的数据通过一定方式捕获,满足内部流程需求,这也是一个可行的起步方式。
数智化与数字化转型的最大的不同之处,就在于AI会带来如阿基米德杠杆般的创新撬动作用,通过一个点的突破就实现一大片业务的颠覆或提升。在2026年,AI正带来更多可能性。而数据,显然正是通往这些可能性的启点。
下一篇:没有了