这是鹿鸣财经第586篇原创文章
作者:金德路
一、潮头更迭刚刚过去的6年,中国保险行业完成了惊险一跃。
最直观的现象是,保险从业者迅速出清。根据北京大学汇丰商学院风险管理与保险研究中心发布的《2024中国保险中介市场生态白皮书》显示,截至2023年末,人身险公司保险营销人员数量为281.34万人,较2019年高峰时期的912万人减少约631万人,降幅达69.2%。
从业者数量一下子回到10多年前2013年的规模水平,这背后是数百万人大进大出,成为保险行业的阶段性过客。意味着,保险行业从2015年开始通过“人海战术”大干快上的大跃进时代落幕。
与此同时,国家监管也在不断积极引导整个保险行业生态的规范。“报行合一”,无疑是整个行业的核心焦点,是整个行业从粗放扩张向高质量转型的关键性政策。
所谓“报行合一”,是从手续费透明化、费用假设真实化和销售行为规范化三个方向上规范保险公司的市场行为,杜绝报备时压低费率,实际却通过高佣金、返佣等“暗箱操作”恶性竞争,防范投资收益补贴高额费用背后隐藏的费差损、利差损等金融系统性风险。
从2017年保监会发布《关于进一步加强保险监管工作的意见》中首提“报行合一”政策的具体措施和要求,到2019年银保监会进一步强调推动“报行合一”政策的落实,再到2023年8月起,金融监管总局陆续发布文件,从银保渠道到经代渠道逐步推行“报行合一”,规范行业生态,2024年8月进一步明确个险渠道纳入“报行合一”。
随着政策的推行,中介经代市场剧烈洗牌,2024年上半年行业标保缩水53%,279家兼业中介退出市场,专业化高的中介经代取得更多市场。对于险企而言,短期内带来阵痛,头部险企银保渠道手续费下降30%,中小公司依赖高费用扩张的模式难以为继,超半数寿险公司亏损。 但是随着时间线的拉长,却引导了行业的专业化与透明化,倒逼企业产品创新(如分红险、养老险占比提升),服务竞争取代价格战。
这个过程中,如果从单个企业的视角来看整个行业的经历,平安毫无疑问是最典型的代表。它不仅曾经是大进大出“人海战术”的受益者,顶峰时期拥有140万代理人大军,这意味着全中国1000人里就有一个人在平安拿取薪水。它同时也是这一轮改革的引领者,2019年这个资产规模数万亿,利润近千亿的金融巨象便率先开启了寿险改革。平安人寿常务副总经理胡景平曾将其形容为“一边开飞机,一边换引擎”。
2021年,平安寿险改革进入深水区,矛盾激烈爆发。最严重的时候,因改革被优化的代理人出现在平安股东大会现场拉横幅。股价也在市场中坐过山车,一会儿逼近百元大关,一会儿又重挫至50元以下,多空双方来回疯狂博弈拉扯。
内外部质疑之声此起彼伏,鹿鸣财经在2022年推出的《平安没有退路》一文探讨这个过程中平安改革所面临的压力与改革的充分必要性。彼时,平安管理层预判改革还要持续3年,如今3年后,平安寿险改革已经接近尾声,红利开始初步释放。
根据平安财报,2024年归母净利润1,266.07亿元,同比增长47.8%;营业收入10,289.25 亿元,同比增长12.6%,分红总额连续13年保持增长。其中寿险改革成效凸显,2024年寿险及健康险业务新业务价值达成285.34亿元,可比口径下同比增长28.8%,保单继续率显著改善,13个月保单继续率同比上升3.6个百分点,25个月保单继续率同比上升3.9个百分点。
代理人渠道业绩、产能同比提升。2024年,代理人出清提质完成,人员规模企稳回升来到36.3万,可比口径下代理人渠道新业务价值同比增长26.5%,人均新业务价值同比大幅增长43.3%,代理人收入同比提升5.9%,达10,395元/人均每月。银保渠道经营效能增强,新业务价值同比增长62.7%。社区金融服务经营模式也持续发力,2024年存续客户13个月保单继续率同比提升5.7个百分点,新业务价值同比提升近300%。
这表明,以平安为代表的中国保险企业以及监管政策在过去6年几乎完成了一次骨血的再造,风险防范,提质增效的跨越,整个行业从产品、服务、销售、风险防范等各个维度上进入良性发展循环,实现了与发达国家保险行业发展阶段的对齐,并且仍然有巨大的市场滲投率和空间可以挖掘。平安联席CEO郭晓涛直言,“我们相信寿险进入了黄金的发展期。”中国保险和世界保险同业第一次站在了同一个起跑线,共同探索再往前一步的发展方向。
与此同时,新的行业时代命题也悄然诞生。以大模型为代表的人工智能技术迅速席卷而来,从国家到行业到企业甚至于个人都有了同一个命题:在AI时代如何自处?
马明哲更是将这个问题直接表达在平安的业绩报中:如何在AI驱动的产业变革中,进一步全面巩固、加速提升数字化能力和水平,加力发展新动能?非为如何应对变革,而是成为变革本身;非求在浪潮中生存,而要顺势而为、把握浪潮新方向,是我们作为中国新時代企业要回应世界的时代命题。
在这个命题之下,平安主动调整了自己的战略结构,形成以“综合金融+医疗养老”为核心战略,“科技赋能”则作为整个支撑金字塔战略的核心底座,并且重点强调全面数字化战略是2025年的首要任务。那么,近万亿市值的平安是怎么理解AI,怎么理解大模型,必然是整个行业视野的核心关切。
二、全新的变量2022年底,ChatGPT横空出世,一波关于大模型技术发展的浪潮开始席卷全球。马化腾在腾讯总办会议上说,“一开始我们觉得是几十年难遇的机会,但是慢慢发现这可能几百年难遇的机会。”
相较于以往的AI技术,大模型技术的特点是具备了一定的自我学习能力。它不用人工示范所有的场景,只需要大量历史案例、数据,就可以通过预训练进行自我学习,记住很多场景知识。尤其是具有博闻强记能力,使得它可以在不同的情况下像人一样的交流,拟人化程度比较高。中国平安首席科学家肖京博士将这个阶段总结为,“有了一定的温度,但它缺乏思考,产出的结果可解释性和可控性较差。”深圳一家互联网大厂的高管对这个阶段也有类似的共识,“尽管AI代表了未来,但也意味着高度的不确定性。”
但是在以Deepseek R1和OpenAI o1为代表的强思考模型出现以后,局面就完全不同了。大模型不仅能够自我学习,还能够强思考、发散思维、举一反三、触类旁通,结合全新强化学习规模法则,实现终身学习、持续成长、持续不断地进步,并且逻辑清晰,思考路径可见,有全局拆解的整体规划,可解释性很强,如果出现了错误可以追根溯源、针对性地改正、优化,应用可控性大大增强。
这种变化产生的直接结果是,人工智能其实发展几十年了,除了自动驾驶外,一直没有大规模的产业应用案例,但是大模型出现后,尤其是DeepSeek在春节出人意料地点亮了中国的ChatGPT时刻后,千行百业都疯狂想要拥抱AI,抓住产业升级的机会。肖京认为,这里面存在一个顺序的问题,产业规模大、利润率高、数字化基础好、业务流程长、人力成本高的产业会更快地融入AI,实现商业价值。
这个阶段的AI如果应用在金融、医疗等业务领域,经过最优秀的专家调校和指导,就有可能通过持续自我学习,逐渐接近甚至超过人类专家的服务水平和温度感,进而得到客户认可和信任。肖京举例到,就像钢铁侠的超级秘书贾维斯一样,因为他能力足够强,他可以得到钢铁侠的充分信任,连生命安全都可以由他负责。未来有很多靠知识和经验提供专业服务的领域,很可能会有一种新的形态,变成少数的优秀专业人员来调教指挥一群机器人,来提供客户服务的模式。
平安联席CEO郭晓涛则将AI应用的价值总结为效率和智慧。效率指的是它能够大幅提升社会、企业的运转速度,提升工作效率、缩短工作时间。智慧则意味着,企业经营决策的模式将会发生从“后知、后决、后行”向“现知、现决、现行”,再到“先知、先决、先行”的转变,用数据决策来代表经验决策,实现聪明经营。
经过频繁的开会讨论之后,有的是一对一,有的多个业务管线共同参与,甚至和外部很多大厂进行了深度交流。平安高层最终发现,从保险、银行、证券、基金等综合金融大板块,到医疗养老的各个专业服务场景,甚至细分到各个险种不同产品多种服务众多投资细分风险防范的维度,大模型将会给产品端和资产端带来深刻的影响和变革。内部从顶层到各个细分管线业务很快达成了共识:DeepSeek这种人工智能技术和金融融合肯定是大势所趋,甚至形成了大模型技术将会加速金融业从业务流程到服务模式再到产业生态三个维度颠覆的预判。
颠覆的背后,往往可能导致产业格局的整体重构。DeepSeek R1实现了性能比肩OpenAI o1,并且成本有了数量级的降低,AI普惠成为可能。更重要的是参数是全面开源的,让行业应用门槛大幅降低,不管是哪家公司,谁都可以简单地通过私有化的部署,就把DeepSeek这种模型应用在各自的业务场景。
这意味着,谁能够将AI更快更深度的融入产品创新、业务流程、服务模式上,谁就能够实现业务的迅速增长或者弯道超车,并且时间线拉得更长来看,这种优势将会越滚越大,行业马太效应将会进一步加剧。
一位平安内部人士指出,眼下这个时间点,不管是对小到创业公司还是产业巨头来说,AI其实已经不是选择题了而是必选项,对于平安来说也是如此。
三、优势与方向平安是中国最早开始研究AI的金融公司,2015年3月加入的首席科学家肖京则是推动平安AI研发和产业应用的核心人物,在此之前的背景是2013年马明哲为平安提出了“全面拥抱科技与互联网”的五年转型计划。
这位曾经领导了微软搜索引擎算法研发的AI专家在加入平安前,师从两位业界著名的老师,其中一位是中科院自动化研究所原所长、科技部原副部长、视觉领域经典教材《计算机视觉》的作者马颂德,另一位是美国卡耐基梅隆大学计算机视觉泰斗、美国工程院院士金出武雄。
他加入平安后迅速组建了2000人的AI团队,启动了“平安脑”智能引擎的研发。2016年,平安的人脸识别技术能力达到全球第一的水平,声纹识别的准确率来到了业界震惊的超99%,推出的“智能闪赔”场景应用,将车损定险从小时级压缩至5分钟,准确率95%。彼时,同为深圳科技巨头的腾讯刚刚启动AI研究,成立核心技术部门AI Lab。
在这个过程中,他带领团队发表了包括融合图计算、对抗神经网络等技术在内的论文102篇,中美专利210项,其中基于自然语言处理NLP的语音机器人四次获得国际冠军。在2019年,肖京获得了中国AI领域的最高荣誉“吴文俊人工智能杰出贡献奖”。经过这些年的发展,平安的5大实验室已经沉淀了大量关于AI的基础研究成果,科技专利申请数已经超过55080项,在金融科技、数字医疗等领域排名全球第一,就算在生成式人工智能领域,联合国知识产权局发布的专利报告中,平安的专利申请数也是全球第二。
除了研发成果,平安的研发团队也在这些年快速增长。截至2024年9月30日,平安已经拥有超 2.1 万名科技开发人员、超3000 名AI科学家。超过2万人的队伍,在当下的大模型语境下究竟往哪个方向走,这是摆在包括肖京在内的平安管理层的方向性问题。而这个命题事实上也是市场上每个企业所必需要回答的问题,例如DeepSeek母公司深度求索则是在大模型的底层技术上发力,阿里巴巴则是围绕通用大模型以及大模型时代的基础设施上下功夫,而在腾讯总办内部会议上,马化腾提出AI普惠抓住AI应用的机会。
腾讯瞄准C端应用的底气,来自于其微信和QQ在中国社交语境中占据的核心位置,13亿的用户基本盘在下一代设备革命来临之前都很难被撼动。而事实上,平安也有着类似的独特优势。它在综合金融和医疗养老领域深耕超过20年,已经积累了2.42亿的个人用户,沉淀下来巨量的行业专业经验,再加上十多年前就搭建起来的大数据平台,使得这些行业专业经验以数据形式沉淀下来。
以医疗领域为例,平安不仅作为保险公司长期承担支付者的角色,参与到医疗过程中去。还拥有北大医疗集团以及其旗下的十几家三甲医院,以及线下遍布的体检中心和检验检测中心。此外,还通过平安好医生触达了数千万用户,通过全职医生团队提供轻问诊服务。这意味着,平安在医疗领域3P构成的产业三角中实现了全方位的布局,分别是医疗服务提供者(provider),主要是医院、医生,病人(patient),第三个是保险公司(payer),付钱的人,在长期经营的情况下,能够从各个维度沉淀出医疗领域内的海量行业专场景数据。
平安基于这些数据搭建了包括三大金融数据库、五大医疗数据库以及经营数据库在内的九大数据库,成为全球最大金融、医疗数据库之一,形成了30万亿字节数据,超3.2万亿高质量文本语料,31万小时带标注的语音语料,超75亿图片语料在内的海量专业数据优势。一位长期关注大模型一级市场投资人称,这种专业数据优势在中国乃至世界范围内产业界都是绝无仅有的,除了芯片和算法外,数据其实就是决定模型能力最关键的要素。
平安的另一独特优势,则源自于在积累这些数据过程中沉淀出来的数据处理能力和数据安全技术。这是一种伴生关系,金融和医疗行业都对数据安全性有绝对严密的要求。如何在合法正当、目的明确、授权同意及最小必要的原则下,打通全集团接近2万家机构各种类型的海量数据孤岛,显然并非易事。在数据清洗、整合、更新、质量管理、标准化、脱敏安全的机制,严格的权限管理、隐私保护管理规范,以及数据全生命周期安全管理制度都有know how的壁垒。除此之外,平安还通过联邦学习、多方安全计算、先进密码学等技术研发了蜂巢隐私计算平台,构建了面向金融行业的“原始数据不出域、数据可用不可见”的数据要素流通范式,隐私计算加密算法性能达到业界的领先水平,获评为工信部“网络安全技术应用试点示范项目”。
对于平安而言,C端的入口产品和大模型基础设施,显然都不是它的辐射范围。它所处的综合金融和医疗养老的产业复杂度,在深度上扎得更深,用AI深度赋能主航道,其实都远比面向C端做一个AI搜索应用更为复杂。尽管Deepseek为行业重新划下一条科技创新赋能的起跑线,但是平安依旧存在在这条起跑线上独特的专业优势。“垂域大模型这个词语最近一年在内部被非常高频的提及”平安一位技术岗位员工说。
马明哲在财报中也提到了自研垂直领域大模型。肖京对此进一步解释到,大模型简单、直接的应用是降低了门槛,但只是一个入门级应用,适用于专业性要求不高的场景。对于平安这种有科技能力的金融机构,还可以再基于开源模型,利用专业、高质量的数据,通过技术能力实现在金融垂域的模型进一步增强,这样可以站在巨人肩膀上,在垂域上做深做强,全方位地应用在各类金融专业场景,从而推动金融业的全面智能化产业升级。
1月20日,DeepSeekR1模型横空出世,用极低的成本实现了堪比OpenAI o1的性能,标志着强思考模型时代的到来,而且它还开源。这里需要厘清的是,目前包括DeepSeek在内的所有通用模型的开源,只是模型参数的开源,并不开源训练数据和训练代码。强思考模型的训练数据又和以往的训练数据有较大差别,最直观的是它需要更多思考过程的训练数据。之前训练数据大多以静态数据为主,比如医疗的知识库是静态的结果数据,但是现在要训练模型的思考能力,是需要整个操作中更多的思考过程数据。
“比如说一个理赔员去看有没有欺诈的时候,他不只是给一个最后的结果,这个案件给你一个最后的数据,他还要提供先看什么资料有没有问题,再看什么资料有没有问题,做完所有的动作之后,再根据什么要点、要素做出判断,这样的过程准备好,才能真正让大模型学会优秀员工的思考能力,这些数据我们要不断去完善。”
如此高质量的专业领域训练数据要求,显然拔高了垂域大模型的研发难度。“这样的数据不仅市场上没有,连我们也不可能有现成的”肖京感叹到。最终,平安采取了多种方式一起来生成这类训练数据,一种是大模型辅助生成,通过框定限定输出条件生成训练样本,这是一种高效但是无法完全避免幻觉的方式,需要有专业人员去对齐完善、补充、修改,最后形成数据。第二种,从过去历史的案例数据里面,专业人员纯手工总结、归纳、思考,把作业过程、完成工作的完整过程总结归纳形成数据。
其实可以发现,无论哪种方式,都意味着巨大的成本投入,但正是因为这样却造就了更高的技术壁垒和能力领先。整个链路形成了一个完整的飞轮闭环,因为金融、医疗专业场景的耕耘,沉淀了无可比拟的专业数据,专业数据可以打造更有竞争力的垂域大模型,而训练具备推理能力的垂域大模型又对训练数据提出了更高的要求,反过来又提高了沉淀的数据质量和完善了数据结构。
四、能力与工具箱ChatGPT点燃全球的AI大模型热情以来,整个市场都充斥着严重的FOMO情绪(害怕错过)。
大到科技巨头、产业王者,小到小微企业与个体创业者,都被这种情绪所左右。这种情绪一定程度上,导致整个市场中出现的各种现象。AI四小龙横空出世迅速被资本和巨头捧高,一场关于基础大模型的技术军备竞赛就此展开。
科技巨头除了押注市场中创业团队,也在自身体系内不断出牌,例如阿里云在一开始就选择了赛道通吃的技术路径,不管是开源还是闭源一股脑的全上。而字节跳动则从通用大模型到C端入口应用,甚至于AI硬件等全方位疯狂出拳。最疯狂的时候,连一两个人的个体工作室都想要买两片4090,部署个7B的开源小模型进行微调,这也直接炒高了英伟达4090的价格。
一位二级市场关注AI的首席分析师指出,“要辩证的看这个问题,虽然短期可能造就资源过度集中,出现一些资源浪费,但是拉长时间线来看,有可能就会发现正是这种热潮推动下沉淀下来长期价值。”这点也在平安的大模型实践上有体现,平安一开始也做了大量通用基础大模型研发工作,而现在则把自研垂域大模型作为重点,引来市场上一些质疑其合理性。“这是必须的过程,没有人能在一开始想清楚定位,大家太看重结果,不关注过程,正是在这个过程中沉淀下来一系列极具竞争力的底层技术能力,才构成平安的长期技术价值。”平安一位技术线中层评论到。
平安的确是市面上少有甚至说是唯一具备全栈AI体系能力的金融科技公司。在DeepSeek出来前就完备了包括通用的、垂域的、场景在内三层结构的模型平台,以及模型背后完善的工具平台,部署、测试的数据集、测试的系统,甚至高效打造Agent的智能体平台也是完备的。在高盛最近提出的中国AI投资框架中,在一众科技公司的列表中平安是唯一的综合金融机构。
肖京介绍到,“相较于同业平安一定能更快技术用在具体场景中,比如已经在用A模型,现在如果发现DeepSeek效果更好,最完备的全体系能力,可以实现最快速地接入最先进的技术。” 肖京进一步补充到,“在目前AI发展日新月异,基本上每天都在更新、每天都在迭代的情况下,你需要有这样的底层能力,才有可能快速地应对市场的发展、技术的发展,引入到我们的实际的业务系统中去,并且发生价值。如果没有这些能力,你只能眼睁睁地看着,你还没把上一代技术融入你的系统,下一代技术就已经出来了,这样你就永远是在落后的状态。但平安就不会有这个问题,因为我们已经有所有的条件了,我只要简单引入就可以了,所以我们肯定是这个行业里最快能把价值发挥出来的。”
这其实就是这个行业两种最主要的底层思路区别,一种认为模型能力和成本维度都是向好发展,深度入局可以等性能和性价比都到一个较好的区间,能最快发挥出价值。第二种是,深度参与这个发展过程,沉淀底层能力,价值在这个过程中慢慢显现出来。平安显然不想等待。
首先是,大模型底层核心技术的研究。例如,新型的大模型算法框架,可能会带来训练和推理成本的大幅降低与效率提高。快思考、慢思考融合的创新模型技术,不同场景下更有的服务体验,因为有的场景是需要快速反馈的,有的场景是需要深度思考的。
其次是,在模型层发力,打造三层模型体系。第一层是通用模型,就像DeepSeek这种通用模型,所有场景都通用,但在垂直领域性能未必最佳。第二层是针对每个垂域建立的综合模型,综合金融和综合医疗领域都有专属的垂域模型,利用金融和医疗领域专业知识对这类大模型进行训练,再结合金融领域的作业思考过程、操作过程,训练它的思考、推理能力等等,进而得到垂直领域的综合模型。第三层是针对具体场景的场景专属大模型,它可以是在第二层模型基础上,加上搜索增强、知识库,就能够达到具体场景最优使用的场景,如果达不到最优,就需要专门在这个场景上准备数据,然后去调整模型参数进行训练,使得这个场景下的表现特别好。通过三层模型构建,基本可以覆盖所有场景需求,而且是能够适配不同场景使用不同模型,不是所有场景都要用指定哪一层模型,可以自主选择。
支撑这样模型在垂直领域垂直打造的底层能力,除了大模型训练过程所需要的数据处理能力,还有就是大模型复现技术能力。不仅要求有能力读懂不同大模型的技术细节、不同能力是怎么训练的,还需要掌握复现这些能力的技术。例如,如果利用DeepSeek作为底层来做垂域增强模型,首先得复现垂域的预训练、智能微调、强化学习、蒸馏等等技术,再结合代码能力和数据能力进行模型训练。“虽然不是从0开始自研,但是我们是站在巨人肩膀上做自研,得到的就是自主可控的垂域模型”肖京解释到。同样的底层技术能力,再基于垂域模型,就可以训练出各个专属场景的模型,包括投资领域里对于某个场景的投资决策模型,多病种肿瘤模型,复杂险种核保模型等具体场景模型。最关键的难点在于,底层技术能力和专业场景能力在这个过程中,深度融合才能达到场景最优。
例如,在AI医生领域,平安健康(好医生)联合平安集团科技构建的“平安医博通”多模态垂域大模型,打造了12个系列的业务场景专属模型,赋能健康医疗服务的各个环节,效率和质量指标都有明显提升。AI体检报告解析精准率可以达到98%,以前的流程是体检完以后,客户上传一个体检报告需要人工看,发现异常,并且给出异常的诊断,再帮他去做一些解读服务,基本上是要等3天的。现在上传到好医生平台,秒级出来解析报告,精度比人高,以前靠人解读还不一定有98%的准确率。在咨询、诊断的准确率都超过95%,红线率都是低于1%到0.1%的,智能推荐的准确率到99%,慢病管理的改善率达到90%。AI能力大幅地提升了医生水平,因为它只要解释了98%,最后诊断由医生来下。原来医生要从头做到尾,现在病历百分之百都是AI机器人来写,医生只看一下就可以了,这样不但提高了效率,也提高了服务质量水平,医生效能大幅提升。
同时,模型工具平台和智能体平台的搭建,也有利于模型快速应用到场景。通过增强训练和模型蒸馏技术,将庞大复杂的知识有效提炼并转移到轻便高效的端侧小模型和云端大模型中,以及快思考小模型和慢思考大模型技术工具化形成模型工具平台,具体场景的专业业务人员都可以方便自主打造所需要的各自不同场景专属模型。而有了智能体平台,不管是各个业务管线从下到上,还是从集团顶层到业务线,还是业务管线间的横向拉通,都是快速基于模型构造出应用到具体业务场景中的agent。老黄在今年的英伟达GTC大会上也阐述了建设AI工厂会是他们未来的战略重点,所谓AI工厂,实际上就是智能体平台。
“方向明确了,能力具备了,效率自然也就高了”一位长期关注平安的记者评价说。模型技术、训练工具、专业数据、应用平台全都齐备的情况下,对于平安而言,只需要再在三件事上做好就能够产生更高的价值了。首先是把垂域模型做深做强,全面补充更高质量更多场景的专业训练数据,使得垂域场景性能更优,壁垒更深。其次是,将模型工具平台和智能体平台的易用性和完备度越来越好,提高内部使用效率。最后就是走进场景,和业务进行更深层次的结合。
五、模型与场景的匹配2025年1月,梁文锋本想安心回广东湛江过个春节,深度求索公司赶在小年前几天发布了DeepSeek R1模型。这一安排却意外使得整个中国众多AI行业的工程师,必须在春节期间加班,无法回家过年。比如,腾讯在2月2日宣布腾讯云支持一键部署DeepSeek R1模型。2月2日是大年初五,随后在1个月的时间,腾讯各个产品才逐步接入DeepSeek R1和V3模型。
看到DeepSeek R1模型效果的那一刻,肖京就立马意识到,这个模型所带来的意义可能非同一般。“DeepSeek这次的进展和突破,捅破了OpenAI先进算法的窗户纸”肖京评价说。平安没有丝毫犹豫,立马在大年二十九那天开始了DeepSeek的引入工作。
第一件事便是测试。首先,28万安全合规测试集测试其是否满足金融监管要求。其次是性能测试,23000个能力测试集,模型效果、推理性以及是否可商用的评估很快就会直观显现出来。平安的技术团队在大年初八就完成引入了DeepSeek包括满血版和蒸馏版在内的全栈模型,并且推给了全部员工使用。
紧接着是模型的垂域增强训练。得益于在之前已经完备的AI体系能力,工具、流程的标准化也很完善,其中DeepSeek 32B参数的模型在开年后一周就完成了增强训练,垂域升级后相比于原来的通用模型在垂域上的性能提升了8%。彼时,腾讯元宝才刚刚上线DeepSeek满血版,但是平安内部来自员工办公、员工作业、员工辅助的场景使用需求已经能达到每天25-30万次。AI代码系统中的一些场景,也在上线3天后成功替换为DeepSeek,短短3天就产生了30万行代码。
最后,在进入业务前还需要进行模型与业务场景的匹配评估。“DeepSeek引进来后,不是把我们以前的模型全部替代掉,它成为底层通用模型的一个选项”肖京解释到,替换的前提是在应用系统和应用场景的测试中,性能和准确率要更好,速度、响应时长、并发等效率更高,并且成本也不增加。目前,平安对大模型赋能场景分为三类:一是存量业务场景升级,内部称为“老树开新花”;二是“新枝发新芽”,一些原来做不到业务,通过DeepSeek升级以后,能够覆盖新场景;三是“沃土生奇苗”,基于AI完全从0到1打造的原生应用场景。
平安在生产业务环节应用场景中评估了77个场景,比如车险理赔、核保助手等这些大场景,其中有30个场景已经用DeepSeek替换了,就是经过测试之后发现DeepSeek的准确率更高,性能更好,成本也不增加,还有21个没有以前平安自己的大模型效果好。在77个场景之外的成千上万场景,以前的小模型效果都更好。
另外还有26个场景还在继续评估,有些复杂严肃场景能力DeepSeek模型还不具备,例如投资决策,复杂疾病诊断,虽然比以前好,但是也没法直接用,幻觉错误太多了。在有幻觉的情况下,尽管有技术可以降低幻觉的发生概率,但是还是有发生的可能性,这种可能性就对模型的准确度、可靠性的挑战很大。这种场景使用之下,应用方案落地就需要人工补齐适配大模型缺点的设计模式,比如说人机协同模式、人工兜底的模式,降低幻觉带来的影响,这些都是提出了很高的要求和挑战。
六、“避免错误才能获得成功”多数人只关心机会,而忽视背后所存在的风险。“安全”、“红线”、“底线”、“风险”,是肖京这一个小时对话过程中提到的最高频词汇。
平安所处金融和医疗行业,都是严肃的风险敏感行业,产业复杂度远超大多数其他行业。对于BAT字节这样的大厂或者更大范围内的创业公司而言,他们推出一款AI的应用可以采取先上线,再在过程中慢慢调整数据的使用规则,模型的训练优化等环节,例如腾讯元宝在推出半年后才遭遇用户数据条款质疑风波。
金融和医疗的严肃业务场景的AI使用,显然不能采用这种方式,因为不管是数据还是业务结果一旦有所偏差都会产生极为严重的后果。平安内部AI模型上线有一个指标门槛,叫红线率。比如AI医生上线,要去做咨询、收集信息,它一定是要红线率低于1%,有非常低的红线率才能让它上线。“我们看病不能看出人命,投资不能造成投资者大量损失,金融业的保险、银行不能出现客户的误导,这些东西都是底线,我们从来不会为了效率而牺牲安全”肖京强调到。
平安对于风险考虑的起点从训练数据、模型测试开始一直贯穿到整个业务流程。这是行业差异所导致的风险偏好差异,而关于大模型应用所带来的风险主要是以下4个维度:
其一,AI技术本身带来的风险。大模型的训练、推理、应用过程中会产生数据安全、隐私保护、算法偏见、模型幻觉、生成内容不合规等各个环节风险。另外很多大模型应用是以云服务为主的,大量信息在网上传输,也存在数据泄露、滥用、模型篡改等风险。
其二,投入的资源和产出价值不匹配的风险。因为AI大模型应用很耗费资源,投入比较大,但是结果又很难快速取得,如果盲目地大干快上,会产生投产浪费,严重可能带来经营上的风险。
第三,社会风险。AI带来了产业模式、流程、生态的变革,会带来很多从业人员必须要去技能转型,适应新的不同的产业业态,这就会带来一些社会风险。
第四,行业本身的风险。AI应用能力的差距可能会导致行业马太效应明显,强者恒强,进而随着AI使用得越多,会造成市场策略的趋同,给金融市场带来不稳定的因素。
“前两个可以通过技术水平和管理水平的发展来解决,后面两个可能就需要行业和国家的共同参与”肖京分析说。
为了应对这些安全风险,平安还在内部设立了AI伦理治理的1+5+3的体系。“1”是指在集团层面设立CEO牵头的人工智能伦理委员会,制定了很清晰人工智能治理的准则。“5”是5个实验室,“3”是三项具体举措,一个是研究,技术研究、政策研究、行业研究等,这些研究要持续不断地进行,找到新的问题,然后能够全方位防范风险。第二是宣导,对自己的员工、客户、社会进行各种宣导,尤其是对员工要求要完全了解、接受、执行伦理治理的规范。第三是真正的治理和检视,包括数据的全生命周期、模型的全流程,应用系统的研发管理,设立严格的管理、治理和检视的制度。
不过,好在随着强思考模型等模型技术的迭代,可解释性提高,进而更有利于风险的控制。它在出结果的时候会告诉你它的思考过程,因此是有一定解释性的,不像以前是完全黑箱,尽管它还是有幻觉,但是可以通过多方验证引用资料是不是真实的,来分析、判断出它是不是有幻觉。如果发现它有偏见、有幻觉、有些不对的地方,可以找出产生错误的原因,想办法去纠正这个错误。“一切都在向好的方向发展,越来越有希望。”肖京补充说到。
其实你会发现,从2010年左右的科技转型开始到现在的大模型时代,平安的科技探索一定程度上都在遵循的是一种“避免失败”的逻辑。在科技转型的时候,马明哲曾喊出过“平安最大的竞争对手是科技公司”,是因为互联网在当时展现出来的效率,开始渗透进生活的各个角落,比如第三方线上支付,如果不全面的科技转型,极有可能会在日后的竞争中处于不利的位置。
AI大模型的变量,极有可能会带来整个行业的重新洗牌,平安要避免失败就必须要进行持续的改革。而这个时候,又恰恰因为此前科技转型打造的大数据平台,打通了数据孤岛,在金融和医疗各个专业场景上构建起了专业数据优势,找到了差异化的垂域大模型,垒砌自己的城墙。事实上,AI时代语境下,这不仅是平安的命题,也是整个中国保险金融行业的命题。马明哲给出的回答是,“惟改革者进,惟创新者强,惟改革创新者胜。”
所以,在看待平安这样企业的时候,不应该去看它是否有什么机遇,能抓住了什么机会,而是要用逆向思维去分析有什么因素可能会导致它的失败,做了什么错误的决策,是产品创新失败,是投资失败,是市场份额流失,是技术变革颠覆,还是组织效率迟缓等,目前看起来各个方面做得都还不错。
毕竟查理芒格曾经说过,“避免错误就能获得成功”。
主题测试文章,只做测试使用。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/11709.html