大模型狂飙一整年后,2024年应关注哪些关键点?
2023年接近尾声,AI大模型的热度丝毫不减。
谷歌刚宣布为开发人员提供新版Gemini大模型并承诺降低使用成本,微软就推出了拥有27亿参数的全新语言模型Phi-2。在头部巨头动作频频时,腰部玩家开始抱团,比如百奥几何与智谱AI开始共建自然语言-生命语言多模态大模型。
虽然百度等巨头早在2019年前后就已布局大模型技术,但2023年确实算得上是大模型元年,几乎所有头部科技大厂都深度参与研发,热钱不断涌入,将千模大战推向新的高潮。然而,在大模型军备竞赛之余,业内出现了越来越多的冷思考:基础大模型越来越多,能实现产业化落地为何寥寥无几?2024年,AI技术产品化、产业化以及商业化,将是大模型发展的重中之重。
(图片来自UNsplash)
千模大战高潮迭起,产业化成头号难题
从参与企业规模、大模型数量与市场规模来看,中国已是仅次于美国的全球第二大大模型产业中心。
作为国产大模型的扛旗者,李彦宏在上个月的西丽湖论坛上提及一组数据:截止今年10月国内发布的大模型多达238个,较6月翻了整整三倍,HuggingFace平台上可供下载的文本生成大模型则接近3万个。按比例划分,美、中两国已上线/在研大模型数量占到全球的80%以上,吊打其他国家或地区。
据速途网测算,2023年中国大模型市场规模约为147亿元,同比翻了一倍,预计在2028年将突破千亿大关。庞大的市场规模,巨头的高度重视,诱惑着资本不断加大投入;AI对提升生产效率与经济质量有着重要意义,一定程度关系到国家核心竞争力,因此也得到了有关部门高度重视。可以说,大模型狂飙一整年,离不开政策的支持、巨头的重视和资本的热情。
在大模型技术有序发展上我国走在世界前列,网信办等七部委联合发布的《生成式服务管理暂行办法》、北京科委发布的《北京市促进通用人工智能创新发展的若干措施(2023-2025)(征求意见稿)》等中央和地方政府扶持措施相继出炉,为大模型的发展扫清障碍,既提供必要资源倾斜,也避免技术无序发展。
资本方面,百度、阿里、腾讯、字节、、美团、京东、网易等大厂均在布局大模型技术,有实力的初创企业则成了VC们争抢的香馍馍,热钱不断涌入。中国新一代人工智能发展战略研究院的报告显示,截止10月底,国内已有38起大模型投融资事件,现存AI企业已超过2200家。
(图片来自贝壳财经)
而在技术层面,文心大模型、阿里通义、讯飞星火、智谱等国产基础大模型在多个榜单上的评测均位居前列,一定程度上已能与GPTPK。
大模型行业欣欣向荣,但依然存在一些隐忧比如困扰大部分从业者的产业化落地问题。任何前沿技术都要转化为产品或者说应用才能为人所用,才能发挥价值。AI大模型当前在基础技术迎头直追的同时,更需要深入到产业端的场景中,在企业的生产经营中,或者用户的生活学习中发挥作用。事实上,后者正是中国AI产业一直以来的优势:相较于下棋、画画、作诗而言,中国科技从业者更接地气,善于将技术应用到场景中,让其为产品、应用或者服务所用哪怕没那么炫酷也不重要。
三个标杆案例,看大模型产业化落地之路
大模型产业化的难点很多,比如不同行业数字化程度参差不齐,不同规模、不同领域的企业对AI的应用需求、可承担的成本,有显著差别,这里的成本除了资金等经济成本外,还有应用AI技术改造业务的风险、时间与边际成本。正因为此,当前虽然很多企业都在关注大模型技术,但真正做到用大模型技术来改造业务甚至打造AI原生应用的企业,却少之又少。
不过浪里淘沙,我们也能看到一些大模型技术和产业结合的标杆案例。
1、度小满轩辕大模型:国内首个开源金融大模型
数据驱动的金融业是数字化程度较高的产业,数据库、存储、服务器、自动化、信息安全等等数字化基础设施,均是在金融业率先应用普及。在AI技术普及过程中,金融业很早就在积极探索将AI与客服、风控、授信、营销等场景结合,降本增效的同时,提升客户体验。
2023年,大模型技术爆发。金融科技先锋平台度小满在5月就率先开源了国内首个千亿级中文金融大模型轩辕;9月,轩辕70B开源开放可被自由下载和使用。作为金融场景而生的行业大模型,轩辕在智能化能力、功能服务以及信息安全上均有很强的针对性。
这种针对性体现在多个方面:比如轩辕用来训练的数据集包含大量机构研报、专业名词、行情数据等金融行业资料,赋予了其极强的金融信息理解和处理能力。
在技术实力上,轩辕大模型不遑多让。其已通过注册会计师考试、银行/证券/保险/基金/期货从业资格、理财规划师、经济师等金融领域权威考试。而在清华大学、上海交大和爱丁堡大学联合发布的C-Eval大语言模型测评榜单和微软亚洲研究院、MBZUAI、上海交大联合推出的CMMLU榜单中,轩辕均取得了国内所有开源模型排名第一的成绩。C-Eval和CMMLU是目前较为权威的两大专业榜单,能够同时夺得第一,对轩辕这样的行业大模型来说绝对算得上好成绩了。
度小满轩辕大模型正在金融场景深入应用。
在内部,轩辕大模型已深入赋能度小满营销、客服、风控、办公再到研发等场景,并已初见成效。在代码助手方面,用大模型辅助生成的代码,采纳率能够达到42%,帮助公司整体研发效率提升了20%;在客服领域,大模型推动服务效率提升了25%。在智能办公领域,大模型目前的意图识别准确率已达到97%。
度小满向来都很重视金融科技能力对外输出。度小满CTO许冬亮透露,轩辕在5月开源时就有上百家金融机构发出试用申请。从企业客户的反馈来看,轩辕大模型的专业能力有口皆碑,2.0版本上下文对话长度增加至8K,对非利息收入增长趋势等金融业的深度问题也能给出专业解释。
2、阿里通义千问大模型,在电商行业贯彻AI驱动战略。
2023年阿里巴巴有许多大的变动,用户为先、AI驱动成为新的战略方向。4月11日发布通义千问大模型的时候,时任阿里巴巴集团董事长、阿里云智能集团CEO张勇就表示所有软件都值得用大模型升级改造,阿里所有产品都会接入通义千问。
阿里确实说到做到,作为阿里大本营的电商业务就早已全面AI化。以通义千问大模型为基础,淘天集团推出了一系列面向B、C两端的AI工具。
面向B端的工具包括官方客服机器人、图片智能生成、营销投放自主监测等,今年双11大促期间商家调用后台AI工具的次数超过15亿次;面向C端则推出AI智能助手淘宝问问,上线两个月受邀试用人数突破500万。B端工具可提高商家经营效率、降低流量成本,C端功能则可显著改善用户体验,在电商行业狂卷价格时形成差异化竞争力。
大模型与电商场景的结合,阿里走得最快也最远,马云在阿里内网回帖中甚至提到了AI电商这一让人耳目一新的概念。
3、科大讯飞星火大模型:大模型教育的标杆玩家。
在大模型技术爆发后,星火大模型和教育行业的结合更是轰轰烈烈。今年5月讯飞星火认知大模型1.0版本发布次日,带飞了A股教育科技板块,除了科大讯飞外,学大教育、行动教育、国新文化全跟着涨停,呈现出星火燎原之势。
从1.0到3.0,讯飞星火大模型一直重点攻克代码能力和多模态能力,并基于技术上的突破开发出更多针对学校、教育企业以及教师和学生群体的功能、应用。比如针对学校管理环节的学生及教师信息管理、离校申请审核功能,为教师量身打造的教学课件制作助手,给学生提供的AI一对一启发式对话功能等。与此同时,讯飞在其翻译笔、录音笔、学习机、办公本等教育硬件上也在深入应用大模型技术,强化产品力,巩固在这一品类上的优势。
(图片来自讯飞星火官网)
金融、电商与教育,三个行业的头部玩家,均能在大模型的改造下获得全新增长点,可见大模型产业化并非痴人说梦,而是必然趋势。
大模型开卷2024:有无产业化秘诀?
度小满、阿里、科大讯飞们只是开了个好头,大模型产业化程度依然有很大提升空间,特别是历史悠久、数字化程度较低的农业、制造业、物流航运业、能源业等产业,更是亟需拥抱大模型技术提高生产效率,实现从数字化到智能化的跨越。鉴于此,加速AI技术产品化、产业化和商业化将是大模型行业在2024年的头号任务。谁能率先跑通产业化落地路径,谁就可以在千模大战中笑到最后。那么,标杆玩家们给大模型产业化带来了什么启示呢?
第一,不重复发明轮子,有针对性地选择训练参数和设计功能服务。
基础大模型已经很多了,市面上缺的是能跟抗衡甚至超越GPT的顶尖基础大模型,以及可让千行百业更低成本、更低门槛、更快应用的产业大模型。而要做出强大的产业大模型,需要既懂AI技术又是产业专家。
度小满就是一个很好的例子,一边有背靠百度的AI技术底子,另一边有深耕金融科技行业多年积攒下的产业认知、能力、场景、生态等资源。
据悉,轩辕虽是基于拥有1760亿参数的Bloom大模型训练而成,但也离不开度小满这些年积累的千亿tokens中文预训练数据集,包括银行、保险、基金等行业的基础知识与巨量参数。因为有后者,轩辕大模型才有远超同类竞品和通用大模型的金融信息处理能力,也才可以面向金融业的痛点场景提供针对性的功能服务。
第二,深入贴合行业需求定制大模型功能服务,而不是闭门造车。
技术类公司容易出现拿着锤子找钉子的问题,如果不能贴合真实需求,技术再强大都可能只是自嗨。
为什么度小满、阿里和科大讯飞可以在大模型产业化上先尝到甜头?因为阿里本身就是电商产业的龙头,度小满从成立之日起一直深度参与国内科技金融行业建设,科大讯飞也深耕智能教育行业十数载,它们对相应行业理解非一般企业所能及。读懂行业运作逻辑和深层次问题,就能洞悉企业、从业者的真正痛点,并给出行之有效的解决方案。
以度小满为例,基于的理解、生成、逻辑和记忆四个基础能力,轩辕大模型融合金融行业的使用习惯、优化需求,提供了一系列针对性功能。比如个人信贷管理服务,轩辕大模型为银行客户提供客户历史信息管理、用户多层次需求分析功能,给用户提供专业问题自然语言交互问答服务,充分提高双方的处理效率。度小满在服务金融机构和自有客户时洞察了许多需求,才可以做出真正能用、有用、好用的金融大模型产品。
第三,众人抬柴火焰高,大模型不是独角戏,必须惠及行业参与者。
中小企业是产业链的主力军,然而因为受限于资金实力与人才资源,往往很难再第一时间应用新技术,特别是门槛很高的新技术。相较于深度学习而言,大模型需要巨量算力、巨量数据和巨量算法,门槛高出了许多,对很多企业来说有些可望不可即。这对头部玩家来说是机遇所在,如果坚持普惠开放路线,既可让大模型技术有产业化的落点,也可以在大模型产业化中获取对应价值。
在度小满和北大光华管理学院联合举办的大模型技术与应用论坛上,度小满CTO许冬亮就发表过类似观点,他认为大模型是中小金融机构突围而出的机会,因为它们可通过应用创新加快数字化、智能化升级进程,继而跨越数字化鸿沟。
也不难发现,开放成了成功落地产业的大模型的最大公约数。度小满的轩辕、阿里的通义千问、科大讯飞的星火走的均是开源开放路线。正如许冬亮所言,将大模型能力开放给金融机构,不仅可以加快技术的推广普及,还能降低使用门槛,是实现技术普惠的必然选择。
跟区块链等新兴技术的昙花一现不同,大模型的热度不会骤然下降。一方面,大模型技术在2024年将会纵深到更多产业,C端,大模型驱动的爆款现象级应用一定会出现,B端,大模型产业化的案例只会越来越多。另一方面,大模型技术本质是深度学习技术的延续。AI技术已发展10余年,未来几十年都将是科技产业的基础技术。大模型是AI浪潮上最大的一朵浪花,而AI浪潮,将持续澎湃。
原文标题:大模型狂飙一整年后,2024年应关注哪些关键点?
余承东带来问界M9,有60万预算你会买吗?
华为海思芯片技术被窃取,小米投资的公司14人被抓!
AI服务器中被动器件究竟有多关键?
真难,英特尔再裁,第五轮
Arm在中国裁员70余名工程师
“2023全球十大工程成就”发布,ChatGPT鸿蒙操作系统入选
阿里重大人事调整,吴泳铭"集齐"三大集团CEO职务!
小米汽车泄密当事媒体致歉:误将工信部申报图当作小米不设密
OFweek人工智能2020年度盘点专题
OFweek维科网2021元宇宙产业发展高峰论坛会后专题
OFweek2021第6届物联网与人工智能大会暨展览会会后专题
戴尔科技助力制造企业数字化转型
扫码添加客服微信邀您入技术交流群本文地址:https://www.uel.cc/article/d7f35b6f9176819fef3b.html