以基础设施角度看待大模型 智源解读行业生态与开源路径思考
【资料图】
6月9日至10日,第五届北京智源大会在京举行,现场,智源研究院院长黄铁军发布了全面开源的“悟道3.0”大模型系列,并带来一系列产品:“悟道·天鹰(Aquila)”语言大模型系列、“天秤(FlagEval)”大语言评测体系及开放平台,“悟道 · 视界”视觉大模型系列,以及一系列多模态模型成果。
采访中,黄铁军表示,目前制约国内大模型行业发展的一点就是“太热”,业界应避免重复性发力,集中力量办大事。
公开资料显示,智源研究院是国内最早进行大模型研究的科研机构之一,自2020年10月启动大模型研发工作。所谓“大模型”,目前业界有不同定义,黄铁军认为需具备三个条件:一是规模要大,参数达百亿规模以上;二是涌现性,能够产生预料之外的新能力;三是通用性,不限于专门问题或领域,能够处理多种不同的任务。
《中国人工智能大模型地图研究报告》显示,截至今年5月28日,中国10亿参数规模以上的大模型已发布79个。在黄铁军看来,目前行业低水平重复与碎片化现象比较严重,这种现象会造成资源分散,很难形成重大影响的系统性突破。且黄铁军并不认为未来会有几十个,甚至十几个大模型存在下去。大模型只是全球大模型生态中的一个环节,未来全球可能只有极少数的两三个大模型生态。
“大模型最终比的是智能水平,”黄铁军表示,多个大模型存在的地方,肯定是智力水平最高的大模型生态会被绝大多数人使用,赢者通吃的现象从来都是起作用的,最重要的是,应从基础设施的角度来看待大模型,将来智力可以作为通用的社会流通要素,人人都可以得到它,其价格也将类似于水电低成本的方式让全社会使用,这是放大人工智能能力的最佳方式。
“极少数大模型生态起基础性作用,基于智力的基础设施提供各种应用与服务,这是一个正常的生态。”黄铁军表示。为了搭建服务千行百业的大模型生态,智源选择将大模型开源。
此次智源发布新进展的FlagOpen 大模型技术开源体系,旨在打造全面支撑大模型技术发展的开源算法体系和一站式基础软件平台。黄铁军表示,大模型不是任何一家机构或公司可以垄断的技术,而是大家共建共享,行业需共建一个智力社会需要的基础算法体系。在黄铁军看来,Linux和安卓生态差别很大,后者是Google掌控下的开源社区,需要符合主导者的意志。“我们作为非营利机构,期望将来人工智能开源开放的方向是Linux这样的开源开放。”黄铁军称。
另外针对智源开源生态与国内生态之间的区别,智源研究院副院长、总工程师林咏华对第一财经记者表示,大模型具备两层生态的特殊之处——过去所谓的应用生态是第二层生态,与基础大模型更紧密的生态是基于基础模型进行持续训练而产生的领域基础模型,或基于基础模型去训练自身应用,经微调之后的领域应用模型。林咏华表示,智源更适合基于自身开源的基础模型去发展后一类大模型生态。
至于该类大模型生态与国内包括阿里、腾讯、华为、百度等互联网大厂之间的区别,林咏华称,有实力的互联网公司如BAT、华为等,会倾向于用自己研发的大模型。由于其商业原因,大多数不会开源。但更广泛的行业企业,需要在优质的开源基础模型之上再去开发其行业领域适用的模型。
(文章来源:第一财经)