国产大模型的 100 种可能

壮士啊你怀孕了 · 发表于 2023-4-23 20:45:02

您需要登录才可以下载或查看，没有账号？立即注册

×

图片来源 @视觉中国

文 | 明晰野望

4 月以来，市场几乎每天都有各种国产大模型的新信息，一众科技大厂、创业公司陆续公布相关进展，加速入场。

争相涌现的国产大模型，特别是科技大厂基于投入、算力、大数据等方面的优势，为中国自主大模型的发展带来了广泛的可能性。

事实上，BTA、华为等大厂在该领域早有研发，并非新入局者。之所以在 ChatGPT" 教育全社会 " 前 " 隐而不发 "，一是各家的核心业务不同，AI 研发的侧重点也有所不同。二是正如阿里云周靖人所言，在 ChatGPT 出现前讲 " 预训练大模型 "，没有人会感兴趣。

当下，有人在琢磨如何快速推出自己的国产大模型抢占市场，也有人在以算力为代表的底层基础设施层发力。更有人直言，相比于 " 神仙打架 "，更关心国产大模型怎么落地应用，看看这个先进生产力工具究竟如何改变产业与生活方式，以及能否实现超越，由追随到引领？

关于 " 与 OpenAI 差距 " 的讨论也从未停止，如李彦宏的 "2、3 个月 "，王小川的 " 不会低于两年 "，时间定义虽不同，但均表明了其并没有领先到难以追赶的程度。

大戏，才刚刚启幕。

01 "iPhone 时刻 " 与增量市场

" 超越 " 不是伪命题，在中美科技竞争、市场隔离的背景下，中国科技产业需要自己的 "iPhone 时刻 "。

人工智能则是最有希望诞生这一时刻的领域：在过去十余年间，AI 进步由中美主导，投入也最巨大，因此机会主要也在中美之间。

Open AI 的成功，无疑强化了这一观点，并给所有中国科技企业带来了一剂强心针，照着这个路径去做生成式 AI，是能够走通的——这样即能保证 " 革命性技术 " 诞生时离其最近，也能率先进入 " 增量 " 市场。

这是在科技行业低迷的当下，一个难得的增量空间。如果能取得先发优势，就有可能开辟巨大的新市场，或给已有业务，如云计算、电商、游戏、社交、搜索乃至 B 端的千行百业加上 " 放大器 "。

大模型不仅是聊天软件，更是生产力工具，已是共识。

在阿里云峰会上，张勇称所有产品未来都将接入通义千问大模型，进行全面改造；刘炽平在腾讯财报会上强调，生成式 AI 可成为已有业务的 " 倍增器 "，也可帮助开拓新增长线；任正非更是认为，ChatGPT 把计算、管道流量撑大，华为产品就有了机会。

其中的逻辑是，AI 是数字化时代的 " 操作系统 "，就像移动互联网时代的 IOS 和安卓，加速促进了产业数字化的发展，对生产、生活方式进行下一次重塑，带来更大空间的新领域，而大模型是整个 AI 产业链中，核心中的核心。

从长远看，如果不能取得先机，未来就有可能会影响现有的整个商业模式，甚至被颠覆。

如周鸿祎在 4 月 21 日发出内部信，要求 360 全员拥抱人工智能，称 " 已领先一个身位 "。近期接受采访时也表示，国内 " 搜索引擎百度市占率 60%，公司 30%"，强调 " 在战略上对标微软，搜索上践行必应 "，改写格局的企图心强烈。

百度反应更为激进，做出了全球第一个对标 ChatGPT 的文心一言。另据晚点财经报道，在文心一言内测前，李彦宏每晚和项目团队开会，他们为筹备产品甚至一度睡在公司。

中信建投的一份 " 会议纪要 " 也显示，过去几个月他们调研了很多一线互联网公司，得到一个非常一致的结论：这次是全面的一把手工程，不管是 BAT 还是字节、华为，均是创始人亲自督战，对大模型团队全力支持。上一次出现如此情景，还是 2009 年移动互联网来临的时候。

中信建投因此认为：未来 6-12 个月的 AI 行业会很卷，但也很精彩，各家模型的登场才刚刚开始。

但仅是 " 开始 "，当下国内大模型超过万亿参数的，就有阿里的 M6、腾讯的混元、智源研究院的悟道 2.0，华为的盘古 Σ，千亿以上的也有近十个。

从发布时间看，百度、阿里、腾讯、华为等一线科技大厂，在 ChatGPT 热潮前均已推出过大模型。

百度的 ERNIE 1.0 于 2019 年推出，即后来的文心大模型，目前更新到 3.0 版本；阿里在 2021 年发布语言大模型 AliceMind 和多模态大模型 M6，去年 9 月合并为通义大模型。

腾讯在 2022 年 6 月发布混元大模型，目前更新至 2.0 版本。微信去年 10 月也发布了大模型 WeML；华为盘古大模型于 2021 年 4 月发布，后续发布了 NLP、CV、多模态等多个大模型。

这些都说明，中国科技企业有技术和能力推动一场大模型的变局，当然，差距和阻力也依然客观存在。

02 国产大模型需要 " 新想法 "

李彦宏在文心一言发布后曾说，百度有信心在综合能力上，迅速追上甚至超过 ChatGPT。

这可能不是百度盲目自信，今天的大模型就像一场刚刚开跑的马拉松，" 你追我赶 " 是必然阶段。现在 Open AI 领跑，也许明天谷歌就会赶上来，但也有可能是阿里、腾讯、华为实现弯道超车。

科技行业不同于其他行业的魅力所在之处在于，每一轮科技创新都是由大的确定性和小的不确定性构成，带有偶然性，并不是简单的强因果关系。

但略显遗憾的是，目前多数中国科技公司在做的大模型，包括百度和阿里在算法方面和 GPT-3 架构基本类似，都是基于谷歌的 Transformer，其他方面也是追随 OpenAI 的脚步实践，在迭代速度不如人的情况下，反而差距越拉越大。

李彦宏曾明言，百度 " 文心一言 " 在研发阶段时曾与 ChatGPT 进行对比测试，当时差距是一个月能追得上。可过了一个月再次测试后，发现差距反而拉大了。

阿里云周靖人也坦承，目前通义千问与 ChatGPT 仍有差距，"GPT 还是属于各方面都领先的地位 "。

更为关键的是，ChatGPT" 暴力美学 " 式大模型路径可能走到了尽头。

近日 OpenAI 首席执行官山姆 · 奥特曼公开表示，" 大语言模型规模已接近极限 "，" 我认为我们正处于巨型模型时代的末尾，目前尚不清楚未来的进步究竟来自何处 "。他同时否认了 GPT-5 的存在，" 而且一段时间内也不会有 "。

自 ChatGPT 推出以来，竞争对手众多。

如马斯克已经确认自建 AI 聊天机器人 TruthGPT 与之硬杠，亚马逊也大力投资生成式 AI，谷歌大脑合并 DeepMind 联手追赶等等，还有大批初创公司正在构建更大算法。此外，欧洲各国正在禁用或拟禁用 ChatGPT。

因此尚不清楚山姆 · 奥特曼出于何种考量做此表态，但也不排除巨型 AI 模型时代可能正在结束。这意味着大模型进化的 " 下一步 " 需要再次 " 另辟蹊径 "，尤其是国产大模型更需要有 " 新想法 "。

目前生成式 AI 的应用在文本领域相对成熟，从海外已落地或处于 Demo 阶段的应用案例来看，在代码、图片、视频、游戏等领域，海外均有所创新。

但中国显然有更广阔的市场及更丰富的应用场景，这也是中国科技公司天然的本土优势：从 toC 走向 toB。

有很多科技公司的从业人士认为，中国的大模型之路应该与美国市场不同。他们更认可一种 " 两条腿走路 " 的方式，即一边做大模型基础平台开发，一边直接瞄准垂直的行业场景落地，实现大模型与场景化的两翼齐飞。

这样既能持续获得更多更丰富的各个行业里 " 好的原材料 "（数据），也使更多的研发人员有机会深入到一线，用大模型去解决实际问题（应用场景），从而在工程化、产品化、场景化上不断迭代，最终与技术底座形成飞轮效应，走向商业化的正循环。

如华为盘古大模型强调在矿山、电力等场景的应用，腾讯 CV（计算机视觉）大模型在工业质检、医疗影像等领域的落地，及诸多 AI 创业公司深耕垂直行业，都是出于此等考量。

从中长期来看，AI 大模型也一定会加速渗透到更多 toB 的场景，比如汽车、工业（制造业）、航天航空卫星、能源、生物制药等领域，这也是中国数字化发展的主线。

03 "AI+ 一切 " 之数字经济

2018 年时，华为有个 " 达芬奇 " 计划，旨在将 AI 添加到一切产品和服务中，也可以理解为 "AI+ 一切 "。其中最首要的一步，就是开发 AI 芯片，挑战英伟达。

那一年，从产业革命，技术创新的周期视角下来看，应该是数字化和智能化的开端，数据、算力、算法都迎来大爆发，更是新一轮硬件终端智能化趋势的起点，比如汽车、穿戴设备、智能家居等等物联网终端，至今全球已经有接近 1000 亿的 Iot 智能终端实时在线。

但是，并没有数字化时代现象级的应用诞生，不管是自动驾驶还是 VR、AR、智能家居、工业互联网乃至元宇宙，过去几年落地都不及预期。

中国也没有诞生自己的英伟达，美国却又增加了 OpenAI 这个 AI 新标杆。这说明，科技领域永远没有属于追随者的时代。

而大模型之所以形成全球共振效应，因为它可能是全面加速数字化应用落地的超级工具，这是一个全新的节点 : 大模型更多是一个工程上的突破而非技术突破，一旦商业模式确认，各行各业的落地速度会比过往快很多，这也是越来越多的企业急速涌入的根本性原因。

所以在全新节点下，4 月 18 日钉钉全面接入 " 通义千问 "，这意味着阿里大模型正式面向 B 端客户。此前在阿里云峰会上，张勇曾强调，" 面对 AI 时代，所有产品都值得用大模型重做一次 "。

"AI+ 一切 " 的野望始终都在，这为国产大模型的未来带来了何止 100 种的可能性。而钉钉最想实现的一个可能 " 是成为超级 APP"，钉钉总裁叶军如此说。

但在理论上，百度、阿里、腾讯、华为、字节凭借各自的历史积累，都有可能成为 "AI+ 一切 " 的赢家，而不是先做的就一定比后做的好。

目前从不同渠道流出的消息显示，4 月份华为会发布自己的模型，8 月份腾讯大模型要出来；字节版的 ChatGPT 已在内测，但内测之后体验效果不好预计在 9 月上线。

不过决定最终谁能跑出来，一定是先 " 卷 " 一轮。

从中国经济发展的历史来看，无论是家电、新能源车还是电商、短视频直播行业，" 内战必先于外战 "，但 " 外战优于内战 "。

大模型之战应该也遵循这个路径，很多小模型或者小场景的商业闭环会被大模型 " 吃 " 掉。而大模型一旦成功，会是万亿市值规模的巨大空间，当然最后跑出来的也可能是两、三个大模型。

届时，不但会产生中国的 "OpenAI"，中国的 " 英伟达 " 也会有，底层框架更会有。

因为中国大模型只有构建在国产技术底座上，每一层都实现自主可控，才有可能纵深地做持续闭环优化，这就跟芯片及再上层的芯片先进制程都要实现 " 自主 " 是一个道理。

那时国产大模型实现超越，切实可期。

但 AI 从来不只是技术、算力、人才的角逐，更是国家战略的角力。4 月份以来，网信办发布了《生成式人工智能服务管理办法（征求意见稿）》，科技部发起成立 " 国家超算互联网联合体 "，及从去年到现在出台的一系列有关数字经济、数据要素相关政策，都表明了国家的关切与肯定。

也就是说，相对海外对大模型发展的矛盾态度，中国对整个数字经济及人工智能的发展，是持一贯的支持态度，这为中国大模型的未来，加上了一个至关重要的确定性。

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体 App

来源网址：http://www.myzaker.com/article/644511d48e9f0966093741fc

账号		自动登录	找回密码
密码			立即注册

账号		自动登录	找回密码
密码			立即注册