中国大模型“狂飙”又一年:“大浪淘沙”后“由有到专”

最近,随着OpenAI长达12天的“马拉松式”新品发布会告一段落,这家全球瞩目的大模型明星独角兽企图霸占全球科技媒体的头条,但除了Sora等个别关注度高的新品外,实际并未掀起太大的涟漪。与两年前发布堪称AI领域“原子弹”的ChatGPT-3.5相比,大模型过去一年的“进化”恰如这场漫长的发布会,小步快跑、持续迭代,却难以再现令人眼前一亮的巨大飞跃。

证券时报记者 周春媚

最近,随着OpenAI长达12天的“马拉松式”新品发布会告一段落,这家全球瞩目的大模型明星独角兽企图霸占全球科技媒体的头条,但除了Sora等个别关注度高的新品外,实际并未掀起太大的涟漪。与两年前发布堪称AI领域“原子弹”的ChatGPT-3.5相比,大模型过去一年的“进化”恰如这场漫长的发布会,小步快跑、持续迭代,却难以再现令人眼前一亮的巨大飞跃。

将目光收回国内,中国大模型在经历去年白热化的“百模大战”后,今年又迎来了“大浪淘沙”,竞争格局趋于稳定,呈现互联网大厂与初创公司“共舞”的局面。随着大模型技术演进曲线趋于平缓,怎样落地成为被摆在台面、亟待解决的问题,不同行业玩家开始调整各自的业务重点与前进方向,这或将在2025年迎来更为激烈的“生死战”。

技术演进曲线走向平缓

行业竞争格局走向收敛

“OpenAI年末的线上发布会,从侧面说明了基础模型的能力可能已到达了一个临界点,技术进步的曲线已从陡峭走向平缓。”一名人工智能行业资深从业人士在接受证券时报记者采访时表示。

在大模型领域,Scaling Law(规模定律)被普遍推崇。所谓Scaling Law,指的是随着参数规模、训练数据集及计算资源越多,大模型的性能将越好。然而,业内开始形成的一个共识是,大模型规模已到达一定程度,加上高质量训练数据逐渐枯竭,大模型能力的进化速度与去年相比有所放缓,能力并没有十分明显的提升。

不过,虽然指数级的能力增长未在今年复现,但国产大模型在技术层面始终在进步。对国内大模型行业来说,技术迭代速度放缓是件好事,领跑的人速度变慢,追赶者就获得了更多的时间窗口。今年6月,在全球权威测评中,阿里通义千问Qwen2-72B超越美国最强开源模型Llama3-70B,问鼎全球性能最强的开源模型;12月,字节跳动火山引擎对豆包大模型家族进行全面升级,其中通用模型Pro已全面对齐OpenAI最新的GPT-4o模型。

“经过两年的发展,中国大模型在技术上取得了长足的进步。各大厂商和研究机构纷纷推出新一代大模型,不仅在参数规模上有所提升,更在算法优化、性能提升等方面取得了显著成果。”北京社科院研究员王鹏向证券时报记者表示。

在2023年初野蛮生长期的“百模大战”之后,行业在2024年经历了一场大浪淘沙,行业竞争格局从分散走向“收敛”。咨询机构弗若斯特沙利文指出,中国目前在通用基础大模型领域的竞争者已缩减至20余家,主要由互联网企业、云计算巨头及人工智能创业公司主导。

一方面,中国大模型创业公司在2024年形成了相对稳定的“六小虎”格局,智谱AI、月之暗面、MiniMax、百川智能、零一万物和阶跃星辰在投资机构一轮又一轮的资金加持下,迅速成长为AI独角兽。其中,智谱AI、月之暗面、百川智能均已跻身估值“200亿俱乐部”,这一速度是上个时代“AI四小龙”们所望尘莫及的,显示了大模型时代技术演进与融资历程的加快。

另一方面,中国的传统互联网巨头们也在表演“大象起舞”。百度是最早布局大模型的大厂,今年11月举行的百度世界2024大会上,百度首席技术官王海峰透露大模型产品文心一言的用户规模已达到4.3亿。动作稍慢的腾讯和字节跳动今年也在全力加大对大模型的投入,腾讯在今年5月推出了基于混元大模型的AI助手APP腾讯元宝,字节跳动也凭借着流量投放的优势让旗下的AI大模型应用“豆包”活跃用户数在短时间超越一众竞争对手。

“这反映了当前中国大模型市场的多元化和竞争性。”针对传统巨头与初创公司“共舞”的现象,王鹏向记者表示,创业公司的优势则在于创新能力强、反应速度快、市场敏感度高等,能够更快地捕捉市场机会和技术趋势,推出更具创新性和差异化的产品和服务。而互联网大厂资金雄厚、技术积累丰富、用户基础广泛,同时还能够通过自身的生态系统和资源整合能力,为大模型的发展提供更加广阔的空间和机会。“二者各有优劣,谁能脱颖而出还需要看各自的技术实力、市场策略和执行能力。”王鹏说。

产业链上下游处境分化

模型厂商发展路径分野

据咨询机构赛智时代研究报告,大模型产业链主要包括上游基础层、中游模型层和下游应用层。其中,基础层主要包括算力和数据,模型层主要包括通用大模型和行业大模型,应用层主要包括生活消费应用、产业经济应用和公共服务应用等。

值得注意的是,2024年,一级市场的大模型产品也频频引爆二级市场,相继诞生了Kimi概念股、智谱AI概念股和豆包概念股,开了A股市场以创业公司设立概念板块的先河。“这反映了市场对于人工智能长期发展潜力的认可以及对未来盈利模式的乐观预期。”天使投资人、资深人工智能专家郭涛在接受证券时报记者采访时表示。在这些概念板块中,不仅包括为产品提供算力支持及数据服务的厂商,也包括在主要产品中接入该大模型以实现产品升级的各行业公司。

与全球芯片巨头英伟达在AI大模型的风口下营收与股价齐飞一样,随着国产大模型的加快发展,各大厂商在AI算力扩展、AI芯片采购以及数据中心升级领域的资本开支持续增加,产业链上游尤其是算力基础设施率先受益。Wind数据显示,年初以来,算力概念指数累计涨幅达47.66%,服务器概念指数累计涨幅达84.03%。“资本市场的表现往往基于对公司基本面和行业趋势的综合判断。”郭涛认为,相关概念板块的优异表现,表明投资者普遍认为随着大模型技术的不断进步和应用场景的丰富,对高性能计算能力和专业基础设施的需求将持续增长,从而带动相关产业链上下游企业的业绩增长。

与产业链上下游相比,处于中游的模型厂商却普遍面临盈利困境。一方面,从云服务商手中购买算力开支巨大;另一方面,产品商业化目前仍处于探索阶段,远未能形成稳定和足够覆盖成本的收入。同时,以字节火山引擎、阿里云、百度云为代表的云厂商在2024年掀起了大模型价格战,降价幅度普遍达到90%以上,有的甚至直接免费。云厂商的目的是通过降价,以大模型来获取云客户,但价格战让一些资金实力本就不足的厂商“雪上加霜”。

在激烈的市场竞争中,尤其是在互联网大厂直接下场“搏斗”的2024年,AI大模型创业公司告别同质化竞争,发展路径开始分野。例如,很早就开始探索商业化的智谱AI主要发力B端市场,而主打大模型应用的月之暗面则以C端市场见长,MiniMax发力多模态与海外市场,百川智能目前的精力主要聚焦在医疗模型和产品领域。

政策密集催化前景可期

行业从淘汰赛走向生死战

今年3月,开展“人工智能+”行动首次被写入2024年《政府工作报告》,人工智能被赋予了实现技术变革、推动产业深度转型升级的重要意义,也成为当前加快培育新质生产力的重要抓手。

今年以来,各地人工智能产业相关政策密集出台。例如12月18日,深圳印发《深圳市打造人工智能先锋城市的若干措施》,其中提出每年发放最高5亿元“训力券”、5000万元“语料券”、1亿元“模型券”等真金白银的措施,以超常规力度促进人工智能产业的快速发展。除此以外,北京、上海、成都等城市也不断加大产业支持力度,彼此间你追我赶。

“大模型厂商的角逐,已经不仅仅是投资机构之间的竞争,而是已经上升到各个城市产业布局、发展规划的层面。”一名资深的创投行业从业者向证券时报记者表示,投资人在与一些一线城市政府官员交流时,往往惊诧于他们对行业的了解之多、认识之深,而且全国多地都已设立人工智能产业投资基金,AI独角兽背后往往也站着国资背景的股东。

“当前,人工智能政策环境趋于友好,政府加大支持力度,促进了产学研用协同创新,为大模型的发展提供了良好的生态土壤。”郭涛表示,政策的持续催化,为AI大模型的发展前景增添了较强的确定性。展望2025年,相关领域的投入依然有望持续增加,带动国产大模型在技术创新上的继续深化和应用场景的进一步拓展。

如果说2023年的“百模大战”是“从无到有”,那么2024年国产大模型所经历的“大浪淘沙”则是“由有到专”,而进入2025年,行业或将从“淘汰赛”进入到更激烈与残酷的“生死战”。中国科学院院士、清华大学计算机系教授张钹曾公开表示,即使大模型落地之后,也只有少数企业能活下来,因为暂时还没有那么大的市场,而且中国在AI投入的资本并没有那么大,还极度分散。“必须集中资源,因为我们的资源本来就少。”张钹说。

虽然人工智能代表着未来已经成为行业共识,但是谁能够引领这个未来却依旧悬而未决。以大模型“六小虎”为例,虽然它们取得了亮眼的成绩,但同时也面临着巨额资金的持续投入、技术商业化落地等挑战。同时,在经历了2024年火箭般的融资速度后,它们的估值已经达到了较高的水平,明年的融资可能会面临一定的调整压力。“一方面,高估值可能导致部分投资者持谨慎态度;另一方面,创业公司需证明其商业模式的可持续性和盈利能力以吸引后续投资。预计下一阶段融资将更加注重公司的核心竞争力和市场表现,而非单纯依赖概念炒作。”郭涛表示。

来源:飞象网
免责声明:本文内容来源于第三方或整理自互联网,本站仅提供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。

相关推荐

  • 智能算力步入万卡时代,大模型发展还有哪些创新空间?

    近日,中国信通院发布2025深度观察十大趋势,其中提到大模型多维度快速演进,AI终端开启变革新浪潮,智能算力步入万卡时代等产业发展风向标。在专家看来,人工智能的产业链很长,除了大模型的训练之外,还有大量的创新空间有待挖掘。

    2024-12-29
  • 雷军招募“天才AI少女”,小米要做大模型风口下的“飞猪”?

    创业,就是要做一头站在风口上的猪,风口站对了,猪也可以飞起来。 12月20日,有消息称,DeepSeek开源大模型DeepSeek-V2的关键开发者之一——罗福莉将加入小米,或供职于小米AI实验室,领导小米大模型团队。 罗福莉毕业于北大计算语言学硕士毕业,曾任职于阿里达摩院机器智能实验室,主导开发了多语言预训练模型VE...

    2024-12-25
  • AI如何重塑百行千业?业界大咖和专家这样说

    数字科技的2024年,人工智能(AI)无疑是当之无愧的主角。这一年,AI的发展呈现出一系列令人瞩目的态势。在2025中国信通院深度观察报告会上,人工智能再次成为焦点议题,各领域专家从不同的视角出发,就人工智能及大模型技术未来发展趋势展开了深度探讨与解读。

    2024-12-24
  • 中关村科金喻友平:平台+应用+服务的“三级引擎战略”是企业大模型落地最佳路径

    大模型之家讯 12月12日,由中国人工智能产业发展联盟(AIIA)指导、北京中关村科金技术有限公司主办的【2024 大模型技术与应用创新论坛】在北京成功举办。本次论坛以【突破新边界 智见新未来】为主题,汇聚了来自国内外学术界、产业界的多位大咖嘉宾以及 500 余位关注大模型发展的...

    2024-12-13
  • AI如何落地生花?中国电信的答案来了!

    人工智能(AI)作为数字化转型的核心动力,正在以前所未有的速度重塑各个行业,尤其是推动了通信行业与其他领域的深度融合。AI赋能下,通信行业从传统的“连接服务提供者”转变为“智能解决方案的引领者”,在AI浪潮中扮演着至关重要的角色。在2024数字生态大会上,中国电信携手伙伴共同探讨数字生态建设,全面展示了中国电信AI战略布局,并通过基础设施建设、产品应用赋能打造全面的AI产品体系,为数字中国的蓬勃发展提供坚实的支撑。

    2024-12-11
  • AI大模型商业化或受阻!百川智能确认联创洪涛离职 | SU视频

    Copyright © 2024 版权所有 京ICP证110302号京ICP备05049258号-1 京公网安备11010802042906号违法和不良信息举报电话:010-68462438 举报邮

    2024-12-09
  • 中国电信发布全自研视频生成大模型 完成全模态体系构建

    12月3日,在中国电信“2024数字科技生态大会”期间,首届“TeleAI 开发者大会”在广州举办。会上,TeleAI发布视频生成大模型、视觉大模型产用一体化平台、具身智能、智传网等一系列创新技术、产品及科研成果,并发布开发者产业联盟计划。中国电信总经理梁宝俊出席并致辞,CTO、首席科学家、人工智能研究院(TeleAI)院长李学龙作主旨演讲。

    2024-12-05
  • 中国移动助力中国石油发布700亿参数昆仑大模型

    11月28日,中国移动助力中国石油在京举行700亿参数昆仑大模型建设成果发布会,正式发布700亿参数昆仑大模型。中国移动副总经理张冬出席发布会并致辞。

    2024-12-01
  • 腾讯开源3D生成大模型,同时支持文、图生成

    混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”正式开源,支持企业及开发者精调、部署等不同场景的使用需求,可在HuggingFace、Github等技术社区直接下载,免费可商用。 本次开源是腾讯混元继文生图模型后持续开放的一大举...

    2024-11-06
  • 百川智能发布一站式解决方案,助力企业“多、快、好、省”落地大模型

    10月31日消息(报道:李楠)今日,百川智能推出一站式大模型商业化解决方案,即1+3产品矩阵(全链路优质通用训练数据,Baichuan4-Turbo、Baichuan4-Air两款模型和全链路领域增强工具链),该方案“工具多、速度快、效果好、成本低”,能够帮助企业以最低成本实现效果最佳的私有化部署。并支持企业将专...

    2024-10-31