最后一公里不解决,大模子开闭源都一文不值-国际黄金

 行业新闻     |      2024-07-15 18:09

生怕谁也不会想到,百模大战进入商业化下半场,围绕大模子大规模、旷日持久的战争,竟是开源和闭源蹊径的交锋。

最近,在2024天下人工智能大会(WAIC)上,刘庆峰、李彦宏、王坚、朱啸虎、傅盛等行业大佬,揭晓的截然差异看法,再次引发外界对大模子蹊径的关注。

好比,连续输出“开源落伍于闭源”“大模子场景下,开源是最贵的”看法的百度首创人李彦宏,再次直言不讳以为,开源是一种智商税。猎豹移动董事长兼CEO傅盛,则继王小川、周鸿祎之后,直接不虚心反驳李彦宏,称“付费闭源大模子才是智商税”。谷歌前董事长施密特甚至在克日示意,中国AI生长基本靠西方开源,因此必须限制开源模子。

大模子赛道的开源闭源,主要是指模子源代码、模子权重、训练数据是否公然。这场AI浪潮下科学界的战争,并非仅发生在中国企业身上——相比中国企业家的“文明交锋”,外洋企业和大佬更是接纳直接短兵相接的肉搏战方式。

去年2月以来,马斯克一再举事,称转向闭源的OpenAI应更名为“Close AI”。今年2月,马斯克在旧金山法院对OpenAI及CEO阿尔特提起诉讼,要求OpenAI恢复开源并给予赔偿。市场方面,去年7月Meta将Llama2(羊驼)开源后,和ChatGPT发生的一轮轮攻防战,同样精彩纷呈。

风云涌动中,围绕大模子开闭源的白刃战跨越一年半。但至今谁也说服不了谁,谁也未取得决议性胜利,未来走向扑朔迷离。

*能确定的是,对民众和企业来说,无论蹊径若何,解决不了最后一公里难题,开闭源都一文不值。对所有大模子而言,其真正磨练犹如科大讯飞首创人刘庆峰所说,在最后一公里的应用和商业化落地上。

01 开闭源蹊径之争的本质

回首互联网和软件史,开源和闭源的战争一直都在上演。

直到今天,这依然是两股并行、截然差其余气力。开源方面,以Linux、Android、unix为代表;闭源方面,则有Windows、Mac OS、iOS、WP等等。

战争焦点,在于手艺提高、‌平安保障、‌社会价值与经济效益之间的平衡探索。

开源以为,应允许任何人获得并修改软件的源代码,犹如一座桥梁,‌分享、融合才是其存在意义。闭源则以为,软件和代码属于劳动功效,劳动功效需要珍爱和用来获取财富。

客旁观,开源促进软件繁荣和全球局限内互助,拓宽创新界限上,居功至伟。但就商业价值层面来看,此前所有领域都被闭源吊打。

一切手艺蹊径争议终点,需要商业化挣钱。这无可厚非,但需要意识到的是,AI大模子的蹊径战争,和此前任何一次开闭源战争都没可对比性——业界共识是,大模子自己就是一个黑盒子,外界至今难以彻底揭开它的神秘。

从模子、算法到数据,若何发生一个可以使用的模子,无人知晓。未来到底是走向中央化,照样去中央化,都是矛盾而又盛行的说法。

这种神秘性,作育大模子的怪异征——无论是外洋照样海内,都不是巨头的一枝独秀,从科研到创业者,再到千行百业开发者,都可以介入其中,让大模子出现百花齐放、百家争鸣的蓬勃生态。

手艺实力来看,若是以ChatGPT为标尺,那么开源曾很长一段时间落伍于闭源——到去年下半年,这种情形已经改变,许多跨越 ChatGPT 3.5,甚至追赶ChatGPT 4.0能力的大模子陆续宣布。不外,在Sora宣布后,闭源又获得一段时间*。

“闭源和开源大模子,很难说谁就会永远*谁,这是一个永远在动态平衡转变的状态。”多位业内人士就以为,其差距取决于,研发团队能力的差异,以及背后团队所持有的资金、算力、数据。

非得在开源与闭源之间,做选择题吗?显然不是。

现在,在开闭源阵营之争外,另有一条手艺蹊径阵营正迅速扩大——开源和闭源同时并行生长。在外洋,以谷歌为代表;在海内,则包罗科大讯飞、昆仑万维、零一万物、百川智能等企业。

这个阵营的手艺实力,并不逊色任何开源或闭源企业。好比讯飞星火,V3.0版本在中文上全方位逾越Chat GPT,英文上实现对标。而在V4.0版本中,在8个国际主流测试集中*,在文本天生、语言明白、知识问答、逻辑推理、数学能力等方面实现了对GPT-4 Turbo的整体逾越。

02 开源与闭源, 为何可以两条腿走路

“极点商业”考察来看,选择开源、闭源“两条腿”走路的企业,结构大多主要遵照以下路径:在*模子上选择闭源,在较小模子上选择开源。

好比谷歌,就在推出“开源”大模子Gemma后,走上闭源 开源并行蹊径。有报道以为这代表谷歌大模子战略的转变——开源主打性能最壮大的小规模模子,希望战胜Meta和Mistral AI;闭源则主打规模大效果*的大模子,希望尽快追上OpenAI。

在海内,“两条腿走路”的企业也类似。以科大讯飞为例,整体逾越GPT-4 Turbo的讯飞星火V4.0是闭源,通过升腾AI和讯飞星火的互助,打破大模子训练的瓶颈;而130亿参数的星火开源-13B则是开源,在多项着名公然评测义务中压倒一切。

实在,大模子不像手机操作系统,必须在IOS或安卓之间二选一,对开发者、用户、企业来说,思量的很直接:这个大模子是否易用好用,又同时具有性价比?稳固性、平安性是否可以保证?其生态和场景打造,又是否知足用户需求?

这意味着,让所有用户、企业、开发者甚至产业,都能选择合适自己的大模子,就是*的大模子。

这也是科大讯飞“两条腿走路”焦点目的,通过“闭源 开源”完整系统,闭源专注商业应用、产业落地,开源战略是生态开放,两者优势“合二为一”,引发中国大模子的产业、生态活力。

在闭源部门,基于星火大模子V4.0,科大讯飞有面向TOC的AI应用讯飞星火APP/Desk、星火智能批阅机、讯飞AI学习机、讯飞晓医APP;面向TOB和生态同伴,有星火企业智能体平台、招采助手、机械人超脑平台2. 0等等,让企业可以构建自己的智算底座。

卖出传奇生物的巨大迷雾

星火开源公然测评数据‍‍‍‍‍

在开源的星火大模子,科大讯飞的战略是生态开放,通过免费大模子,为开发者、学术界赋能。

“开源 闭源”两条腿想顺遂走路要害,需要解决几个要害问题,一是模子架构自主可控,有一定手艺优势,二是产业落地、商业模式完整,三是通过社区吸引更多开发者。

“谁控制了已往,谁就控制了未来;谁控制了现在,谁就控制了已往。”近年来,被“卡脖子”事宜一再在我国科技产业上演,算力、数据是否会“卡大模子的脖子”,业界也是议论纷纷。

这意味着,主流国产、自主可控的模子架构,才可能*限度施展生态气力,匹配产业上下游环境,更好推进开源、闭源的并行融合。

“所有算法都是我们自主可控的,大模子的每一行代码、每一个数据都是我们自己编写、洗濯出来的。”刘庆峰示意。

而对处于早期的大模子来说,无论是开源、闭源,都需要群集更多开发者,介入到开源模子的改善和优化。

在外洋,包罗Meta、谷歌和微软以及第三方开发者都在社区内宣布模子、参数、数据集;在海内,讯飞开放平台之上大模子总开发者超35万,其中企业开发者超22万,推动大模子应用加速落地。

回首PC、软件、手机历史,实在也有类似案例。好比在数据库市场,Oracle就是“开源 闭源”两条腿走路,在开源社区、商业应用均取得了伟大乐成。

谷歌、科大讯飞们的大模子“两条路”逻辑实在也类似。一种解读是,在大模子时代,开源、闭源只是手段,在差异产物和应用场景中,两者本是相辅相成。开源模子和开源社区可以在上游用免费战略认真扩大用户基数、拓展产业生态、迭代模子手艺。

来自开源部门的履历,也可以复用到闭源,让闭源大模子的产业化、商业化落地更顺畅——最终两条蹊径以多元化、天真化的方式演进,并行甚至融合互补。

“现实上这两块是相互弥补的。”科大讯飞首创人刘庆峰也以为。他以星火开源13B模子为例指出,等650亿、1500亿、1750亿参数以及更大模子出来,就知道了它的天花板和界限,再对它举行裁剪、浓缩,就酿成13B,那13B的效果也提升了。

“若是不做闭源,不探索行业最高的天花板,开源也做不到*。”刘庆峰就以为。

“两条腿”走路的互补价值,浙江大学人工智能研究所所长吴飞一个看法是,任何开源基座模子,都是千锤百炼而来,不是所有公司和机构都具备这样的能力。“在开源之上举行闭源,可以很洪水平上降低闭源模子研发的门槛。”

03 最后一公里才是真正挑战

从刘庆峰、李彦宏、王小川等行业大佬看法来看,一个配合之处是:闭源、开源只是手段,要害是让大模子,若何快速应用千行百业场景里,若何作为生产力工具,更好地普惠,去替换人类完成各种营业流的碎片、繁杂事情。

这意味着,对海内现在尚处于高速生长阶段的大模子而言,随着开源、闭源蹊径的逐渐并行融合,选择什么蹊径不是要害问题。

差异场景适配差其余参数。犹如刘庆峰所说,无论大模子若何演进,最后一公里的产物体验和应用落地,才是真正挑战。

这也是谁能在“百模大战”中占有一席之地,拥有更多的话语权的要害。若是解决欠好最后一公里,那么手艺蹊径将一文不值。当前海内大模子企业的应用开发的普遍思绪是,并未等得手艺完全成熟再落地应用,而是在快速迭代手艺同时,从ToC、ToB两头入手,响应地举行产业和应用落地。

这一点,在刚刚竣事的WAIC上也体现得很显著。科大讯飞、百度、阿里巴巴、腾讯、华为、字节跳动、快手等行业巨头,以及百川、智谱等新锐带来众多新手艺和新产物,展现了大模子和金融、医疗、教育、政务等多个行业、产业的深度融合。

关于若何更好地解决企业大模子应用的“最后一公里”问题,科大讯飞经由和大量的央国企和行业互助同伴的配合探讨,他们以为用智能体平台打造每个岗位专属助手的时间已经到了。

在这之前,星火已经乐成赋能了许多场景,无论是代码、数字劳动力,照样评标、客户、APP智能互动。科大讯飞与太平洋保险互助是从审计这个岗位做起的,包罗客服和评标;此外,国家能源团体、中国石油等公司选了科大讯飞作为互助同伴;同时,星火大模子赋能中国移动APP几亿用户,使中国移动APP加倍智能、交互更顺畅。

通过这么多的场景可以看到,大模子赋能企业“人工智能 ”行动有两个方面:一方面是大模子直接完成义务,讯飞星火一最先启用,文本天生、语言明白、知识问答、逻辑推理和代码能力对应到下面相关的林林总总的工具,它自己就完成了,不需要借助任何外力。

另有一种模式是以认知大模子为中央大脑,它调动种种专用模子,好比说振动的模子、味觉模子、气体模子,湿度模子等种种模子,然后配合响应的工具,再对接内外部的种种信源和数据,买通内部的办公OA、ERP系统,再对接外部实时性来团结完成义务,相当于用大模子来指挥调剂一系列的能力,从而完成一个综合的义务。

面向B端,从刘庆峰论述来看,讯飞星火大模子在“最后一公里”用智能体平台打造专属于每个岗位的事情助手,在智能家电、智能汽车、运营商、机械人等行业场景实现周全赋能,甚至成为各行各业创新生长的主要驱动力。

面向具身智能和人形机械人企业需求,现在400 机械人企业已经接纳讯飞机械人超脑平台。另外,星火企业智能体平台将围绕智能体要害能力,笼罩400 AI原子能力,集成 90 外部信源,买通100 内部 IT 系统,可供企业连系营业场景快速构建可落地的智能体应用。

“解决AI 行动的最后一公里的问题,是亘古未有的时机。”刘庆峰就示意,星火已经乐成赋能了许多场景,无论是代码、数字劳动力,照样评标、客户、APP智能互动。

不完全统计显示,讯飞星火大模子正成为国家能源团体、中国石油、中国移动、中国人保、太平洋保险、交通银行、海尔团体、美的团体等多领域头部企业的*。

公然招标网数据就显示,今年上半年到6月中旬,整个公然招标数目约为234件。其中,60%以上的项目来自央国企。在央国企大模子订单中标企业中,讯飞星火高居*。

“我们能走多远,取决于我们是否拥有自主开发的、可控的基础能。”从刘庆峰亮相来看,这是大模子若何解放生产力、释放每小我私人、每家企业,甚至每位开发者想象力的要害。

“合抱之木,生于毫末,九层之台,起于垒土。”犹如刘庆峰的说法,这正是大模子能力阶段跨越的体现——意味着大模子从手艺附加工具,转向引领行业变化、助力企业降本增效、普惠民众生涯的要害阶段。而针对更多商业化模式的探索,也正悄然形成“模子越强、落地越多、用户越广、算力越大”的增进飞轮。

从这个角度看,只要能做大生态,加速产业最后一公里的落地,无论是大模子手艺蹊径是闭源,照样开源,实在一点都不主要。