资讯中心
本页位置: 主页 > 新闻资讯 > 国际信息 >

套壳的大模子,为何还在世?-国际原油

作者: 正大期货   来源:https://www.xasswkj.com/    阅读次数:     2023-11-17 08:38 【字体:

国产大模子套壳,是个被吐槽已久的征象。 最近,前阿里巴巴副总裁、着名AI框架大牛贾扬清昨日发同伙圈,爆锤海内某大厂套壳大模子LLaMA。 大意是:要改就改吧,但别掩耳盗铃了,

国产大模子套壳,是个被吐槽已久的征象。

最近,前阿里巴巴副总裁、着名AI框架大牛贾扬清昨日发同伙圈,爆锤海内某大厂套壳大模子LLaMA。

大意是:要改就改吧,但别掩耳盗铃了,省得小公司做一些多余的适配事情……

针对这条新闻,业内不少人士纷纷展望,贾扬清所说的谁人“套壳大厂”,现实上就是前不久刚公布了Yi-34B大模子的零一万物。

作为李开复AI团队的*个大模子,Yi-34B有34B个参数,也是基于GPT的架构,且在Hugging Face和C-Eval的两个开源模子排行榜上,都取得了*的成就。

然而,在模子公布后不久,Hugging Face社区就给零一万物留了条新闻,要求其修改模子张量。

理由是:除了两个张量被重新命名外,Yi完全使用了Llama的架构。

看到这儿,不少业内人士纷纷皱眉:这是赤裸裸的“套壳”吗?

若是是的话,为什么大模子浪潮都已经已往泰半年了,这种“歪风邪气”照样层出不穷呢?

01 怎样才算“套壳”?

现实上,在该事宜传出后不久,零一万物就做出了回应,他们认可Yi-34B的结构设计是基于GPT的成熟结构,借鉴了LLaMA的果然功效,然则这是为了与行业主流保持一致,更有利于适配和迭代。

不外,这种注释涉及到了个很主要的问题,那就是:到底该怎样泾渭明晰地界定“套壳”和“借鉴”?

在开源模子的基础上举行修改、调整,事实算不算一种“套壳”行为?

从手艺层面上来说,判断一个项目是“借鉴”照样“套壳”,要害在于评估所做的改善或优化是否具有实质性和原创性。

在借鉴的历程中,开发者会在原有模子的基础上做出显著的增值,例如引入新的数据处置手艺、优化算法性能,或者开发特定于某个行业或应用的功效。

同时,在借鉴时,开发者通常会明确指出,他们的改动是基于哪个开源模子,并说明他们所做的改善和创新。这种做法相符开源社区的原则和精神。

相反,若是改动仅限于外面层面,没有提供任何新的手艺看法或实质性的性能改善,则就可以被视为套壳。

那这次零一万物的Yi-34B,算套壳吗?

从已经宣布的信息来看,零一万物公司的做法似乎介于“套壳”和“借鉴”之间。

他们确着实一定水平上依赖了LLaMA的架构,但也在数据处置、训练方式等方面举行了自己的事情和创新。

例如,其使用了自建的数据管线,从3PB原始数据中精选到3T token的高质量数据,以及在在网络宽度和深度上测试了差其余Norm方式。

这些改善可能不那么容易从模子的架构或代码直接考察到,它们通常在模子的内部,而不是直接体现在模子的基础架构上。

这种情形下,将其完全归类为“套壳”可能有失公允。

但也不能完全视为自力的“借鉴”,缘故原由在于其模子架构与LLaMA架构的高度相似性。

当一个新模子在焦点架构上,与现有的开源模子高度相似或险些一致时,纵然在其他方面有所创新和改善,也很难被完全视为自力的“借鉴”。

02 时间压力

只管零一万物此次的意外,或许算不上完全的“套壳”,但国产大模子“套壳”的情形,确实由来已久。

国产大模子,为何一再“套壳”?

除了算力、人才和资金方面的欠缺,让部门团队“另辟蹊径”外,另一个主要的缘故原由,就是当前大模子创业的时间窗口,已经收得越来越紧了。

智能工厂解决方案提供商「零可达科技」完成千万级天使轮融资,用友产投领投

究竟,大模子这股热潮,已经燃烧了泰半年之久,该入局的玩家早已入局,整个行业的名目已经基本形成。

头部大厂的职位撼动,外洋偕行又不停推陈出新,留给模子层团队的时间,真的不多了。

在市场上同类大模子越来越多的情形下,客户为什么要偏偏苦守着一个研发缓慢,前途又不甚晴朗的大模子?

市场对于快速解决方案的需求迫在眉睫。客户的需求不能等。他们需要现在就能用的解决方案,而不是几年后。

在这样的压力下,部门团队做出了选择:使用开源模子作为基础,对其举行改善和定制,以顺应市场的需求。

究竟,纵然拥有*人才,创新和自主研发的历程也是漫长且充满不确定性的。由于人工智能领域正在快速生长和转变,市场和手艺的不确定性意味着伟大的研发风险。

在今年10月之前,不少海内团队,都将GPT-4当成“对标”的目的。然而,殊不知你在进,你的对手也在进。

9月尾,OpenAI推出了DALL-E3,紧接着又推出了GPT-4V和语音交互功效,在多模态层面更上了一层楼。

而11月初开发者大会的一系列“王炸”更新,则用更长的文本长度、全新的 Assistants API、以及文本转语音(TTS)手艺,抹杀了想在“局部领域”举行突围的国产模子。

在手艺迭代迅速的情形下,许多团队还在苦苦研发的大模子,也许还没公布,就已经由时。

对于创业团队来说,在保持手艺创新的同时,也要思量到商业模子的可行性和市场的接受度。

而有着成熟框架,且获得市场普遍认可的开源大模子,无疑成了一种可靠的,可以马上投入使用的方案。

而且,成熟的开源框架通常有一个重大的社区支持,这意味着团队在遇到问题时可以获得更多的辅助。

同时,社区中的其他开发者可能已经解决了一些常见问题,团队可以直接借鉴这些解决方案,制止重复劳动。

03 套壳大模子,能投吗?

在国产大模子“套壳”已经成普遍征象,而且未来极有可能成为常态的情形下,所有投资人都不得不面临一个问题,那就是:

若是硬是要在这些“套壳”的大模子公司里,物色可投资的企业,那应该怎么选?

在思量这个问题时,有一个异常主要的因素,即:

这些套壳的大模子公司,事实是完全依赖于“套壳”,没有任何自主研发的起劲和设计,照样以“套壳”作为妥协和过渡手段,但有明确的耐久生长设计,有创新的愿景,有能力最终转向自主研发?

这两种情形,需要区别看待。

在对这两类企业举行考察时,一个十分主要的权衡尺度,就是手艺和产物蹊径图。

由于一个清晰、具有前瞻性的手艺和产物蹊径图,直接反映了企业的耐久战略意图和创新能力。它不仅显示了企业是否有设计从“套壳”转向自主研发,还注释了企业未来手艺生长的偏向和潜在的市场竞争力。

现实上,以类似“套壳”的方式进入市场,最后却依赖自研产物获得用户认可的案例,在商业上并不罕有。

例如移动互联网时代的小米,就是一个显著的例子。

早先,小米的智能手机在外界看来,似乎只是模拟了其他品牌(尤其是苹果)的设计和功效。其早期产物被指斥为缺乏创新,更多地依赖于现有的设计和操作系统(基于Android的MIUI系统)。

然而,小米厥后展示了对自身手艺和产物蹊径图的耐久坚持,其不仅在软件上(MIUI系统)举行了大量的自主创新,还在硬件设计、功效创新以及用户体验上举行了显著的研发。

例如其自主研发的手机芯片Surge S1,就标志着小米在手机焦点手艺领域的自主创新。

随着时间的推移,小米依附更多的创新手艺,在市场上获得了极高的评价和普遍的用户基础。

同样地,在当前“套壳”的国产大模子企业中,也不清扫存在着一些有着耐久手艺蹊径的企业。

倘若以这样的看法来看,所谓的“套壳”,也并不意味着国产大模子漆黑的远景。

从产业的角度来说,只有更多具有创新潜力的企业,从AI浪潮初期的“大过滤器”中幸存了下来,未来更多的自主创新,才可能相继泛起。


免责声明:此消息为 正大期货原创或转自合作媒体,登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,请自行核实相关内容。文章内容仅供参考,不构成 正大期货投资建议。