当前位置:首页 > 百科 > 轻量化小模型兴起,中小企业也能搭上AI“快车”

轻量化小模型兴起,中小企业也能搭上AI“快车”

低成本、快车上线快、轻量企业易调试,模型可在特定任务上反超通用大模型

轻量化小模型兴起,兴起中小企业也能搭上AI“快车”

阅读提示

随着人工智能快速发展迭代,搭上一些企业开始押注小模型。快车相较大模型,轻量企业低成本、模型上线快、兴起易调试的搭上小模型,以更高的快车性价比为中小企业和个人用户提供了打开人工智能大门的钥匙。

近两年,轻量企业人工智能快速发展迭代,模型大语言模型如雨后春笋般涌现,兴起文本生成、搭上文生图、语音处理、代码处理、视频处理等生成式人工智能走进人们的生活。同时,一些企业开始发力研发可在电脑、手机端训练的轻量化小模型。

“我们需要高铁、飞机、游轮等大型交通工具,也需要私家轿车、公交车,以及摩托车、自行车等小型交通工具。因为在不同场景下,不同人群有不同需求。”在青岛自然语义公司联合创始人、首席架构师孙燕群看来,满足特定市场的需求,是专而精的小模型兴起的重要原因及其存在的价值。

今年3月,自然语义研发的Euler模型通过中央网信办生成式人工智能服务备案。不同于大模型动辄千亿级的参数量,Euler的参数量只有2.5B(25亿),是典型的轻量化小模型。相较于大模型,小模型有何特点?应用前景如何?记者对此进行了采访。

低成本、易调试的端侧小模型兴起

关于小模型,目前并没有明确定义。孙燕群表示,在行业内,参数量低于100B的模型就算比较小的模型。在实际应用时,要想在笔记本电脑端实现微调,模型参数量一般在3B左右。

相较大模型,小模型在算力消耗、使用成本方面更具优势。具体来说,一是训练和推理所需的硬件资源较少,使得成本较低;二是使用更便捷,可在手机、电脑、物联网设备等计算场景中实时运行;三是结构简单,开发者能快速定位问题,易于调试。

记者了解到,随着大模型的比拼日益激烈,一些企业开始押注小模型。2024年8月,微软和英伟达就相继发布过小型语言模型。国内不少企业也开始研发在“断网、弱网”环境下,让各种智能终端具备自主思考能力的端侧小模型。例如,在今年3月举办的中关村论坛年会期间,北京的面壁智能公司就发布了应用于汽车智能座舱的纯端侧超级智能助手。今年1月,广东佛山移动牵头联合40家单位成立佛山市AI小模型产业联合体,致力于通过人工智能小模型提供个性化服务,助力企业完成智能化升级。

“小模型让我们实现了与科技巨头们的错位竞争。”提到小模型的具体应用场景,孙燕群举例说,Euler通过备案后,已经开始面向中小企业和个人用户提供服务。如与山东某市级档案馆合作,上线了档案模型;与青岛当地一家仪器仪表设备公司合作,开发了内网技术相关的模型。

退而求其次后的“主动作为”

“客观来说,大模型的能力强于小模型,一个参数量2.5B的模型无论如何都不可能超过200B模型的算力。”孙燕群直言,这也是大公司都在做千亿级模型的原因。模型小,神经网络参数就少,容纳的知识量不够,“体现在文本生成上,就是容易出现上下文不连贯的情况”。

自然语义最初的目标并不是小模型。2019年底,该公司考虑要做大模型,但由于发展方向不明朗,同时在购买高算力GPU上面临资金和货源压力,因此未能实施。

“没想到,仅过了两年时间,国外的大模型就发布了。”孙燕群回忆说,后来随着越来越多大企业涌入大模型赛道,作为基础硬件的高算力GPU价格水涨船高。“那段时间,听说哪里有GPU,我们就坐飞机去买,常常是提前交了定金也不一定能买到。”最终,公司用10多台设备组成一个算力集群,能支撑做出7B参数的模型。

为了在现有设备基础上尽可能提高参数,自然语义公司工程师经过头脑风暴,想出了新的分词方式,以及将向量计算从实数空间转换到复空间等各种办法。“经过模型训练,这些技术都达到了比较好的效果,能让一个3B参数的模型,达到了150B参数模型60%左右的能力。”孙燕群表示。

中国信息通信研究院人工智能研究所副总工程师王蕴韬告诉记者,小模型之所以能在“瘦身”后仍保持可观性能,得益于一系列成熟的模型压缩与高效架构技术,包括剪枝、量化、知识蒸馏、设计先天高效的网络架构等。

让“小身材”跑出“大能量”

“小模型发展大有可为。”在王蕴韬看来,未来面向特定应用场景的小模型,潜力将会进一步释放。以AI终端为代表的应用形态及产品服务,将成为小模型释放大能力的主战场。

关于小模型的应用前景,王蕴韬进一步解释,一是为离线办公、文档摘要、私密对话等场景铺平道路;二是随着处理器架构和神经处理单元技术的应用,手机、车载和物联网设备将成为小模型的天然舞台;三是在垂直领域与“专精特新”行业,如金融、医疗、法律、教育等已出现6B及以下参数的定制模型,成本低、上线快,可在特定任务上反超通用大模型。

“市场关心的是能否解决实际问题,不关心背后模型细节,能够与场景深度结合,拥有行业知识,尤其是可信的小模型至关重要。”王蕴韬说。

从用户端来看,在实际应用中,小模型的性价比优势也十分明显。北京某互联网公司算法工程师张先生向记者表示,在现有技术条件下,想要在本地部署大模型存在一定难度。“专业GPU芯片价格太高,无法应用到低价格的终端上,如手机、机器人等配备的芯片就无法撑起大模型。另外,这些终端所配备的电池,往往也支撑不了高性能芯片的耗电等。”张先生表示,这些硬件性能有限的终端,更适合小模型施展。

王蕴韬分析认为,未来将是大小模型混合的系统范式。“云端大模型负责通用推理,端侧小模型承担即时响应与私域数据处理。”他还强调,小模型并非“大模型的低配版”,而是面向资源受限环境与专用任务的高性价比解法。通过配合端云混合部署和行业数据精调,企业完全可以让“小身材”跑出“大能量”,在AI商业落地的下一程中获得确定性收益。(工人日报 记者 陶稳)【编辑:于晓】

(责任编辑:探索)

推荐文章
  • 西藏日喀则协助45名因山洪滞留的印度香客安全出境

    西藏日喀则协助45名因山洪滞留的印度香客安全出境 中新网拉萨7月10日电 (记者 江飞波)西藏自治区日喀则市官方公布,受吉隆县7月8日洪水灾害影响滞留的45名印度香客,于7月9日在日喀则市相关部门协同保障下,全部安全经由聂拉木县樟木口岸顺利出境。7月 ...[详细]
  • 国家统计局:2025年全国夏粮稳产丰收

    国家统计局:2025年全国夏粮稳产丰收 中新网7月10日电 据国家统计局网站消息,国家统计局农村司副司长魏锋华解读夏粮生产情况时表示,今年以来,各地区各部门严格落实粮食安全党政同责,压紧压实粮食生产责任,积极克服旱情等不利因素影响,全国夏粮 ...[详细]
  • 南越王博物院展出300余件(套)文物

    南越王博物院展出300余件(套)文物 中新网广州7月10日电 (程景伟 张跞乐)“甄·集——南越王博物院藏品征集成果展”10日在南越王博物院王宫展区正式开幕。展期将持续至11月30日。该展览是南越王博物院建院以来首个系统梳理并公开展示藏品 ...[详细]
  • 中国-东盟(10+1)外长会在马来西亚举行

    中国-东盟(10+1)外长会在马来西亚举行 当地时间7月10日上午,中国-东盟(10+1)外长会在马来西亚吉隆坡举行。(总台记者 陶家乐) ...[详细]
  • 中国南方电网电力负荷创新高 广东用电负荷突破1.6亿千瓦

    中国南方电网电力负荷创新高 广东用电负荷突破1.6亿千瓦 中新社广州7月9日电(王华 蓝旺)连日持续高温带来用电需求持续攀升,7月9日17时10分,中国南方电网最高电力负荷达2.52亿千瓦,创历史新高。其中,广东成为中国内地首个电力负荷突破1.6亿千瓦的省份 ...[详细]
  • 多家货运平台联合签署自律公约:保障运费及时结算

    多家货运平台联合签署自律公约:保障运费及时结算 中新网北京7月9日电(记者 吴涛)“严格货源信息审核”“保障运费及时结算”“不强制通过其他平台揽货”……7月8日,多家货运平台联合发布《网络货运信息交易撮合平台保障货车司机合法权益自律公约》(简称《自 ...[详细]
  • 我国人均预期寿命提高到79岁

    我国人均预期寿命提高到79岁 中新网7月9日电 7月9日,国新办举行“高质量完成‘十四五’规划”首场新闻发布会。国家发展改革委主任郑栅洁在会上表示,在“十四五”期间新增布局114个国家区域医疗中心、现在总数达到125个,全国跨省异 ...[详细]
  • 广州海关查获涉嫌侵权Labubu玩具4.32万个

    广州海关查获涉嫌侵权Labubu玩具4.32万个 中新网广州7月10日电(许青青 关悦)据广州海关10日消息,近日该关在广州南沙口岸出口货运渠道查获涉嫌侵权Labubu毛绒玩具一批,共计4.32万个。广州海关所属南沙海关关员在对一票申报为“保温杯、首 ...[详细]
  • “中国金牌龙眼之乡”广东高州龙眼抢鲜上市

    “中国金牌龙眼之乡”广东高州龙眼抢鲜上市 中新网茂名7月9日电 (梁盛 梁晶晶)记者9日从广东茂名高州市农业农村局获悉,时下正值龙眼果实膨大期,部分产区的早熟龙眼开始“抢鲜”上市。据了解,作为世界储良龙眼的发源地和中国金牌龙眼之乡,高州龙眼种 ...[详细]
  • 402种药品新增进入国家医保药品目录

    402种药品新增进入国家医保药品目录 中新网7月9日电 7月9日,国新办举行“高质量完成‘十四五’规划”首场新闻发布会。国家发展改革委副主任周海兵在会上表示,402种药品新增进入国家医保药品目录,医保跨省结算更加便捷。高质量“一老一小”服 ...[详细]
热点阅读