大模型破局之战：赛点走到“产业应用”

【摘要】谁将领跑大模型金融产业应用

自2022年底以来，ChatGPT引发了人工智能新一轮创新热潮，各大企业更是争先拿出各自的大模型产品，尤其在中国市场的竞争，已经进入白热化阶段。由中国科学技术信息研究所、科技部新一代人工智能发展研究中心联合相关研究机构编写的《中国人工智能大模型地图研究报告》更是显示，中国已发布的AI大模型已有79个。

但近日，这场没有硝烟的战争，风向仿佛发生了一些微妙的变化。首先是ChatGPT的月度流量首次出现下降——2023年6月份，ChatGPT网站在全球的桌面和移动端流量比5月减少9.7%，独立访客减少5.7%。

(相关资料图)

摆在各行各业面前的一个问题是，除了聊天对话之外，还能解决什么问题、带来什么样的商业效益？毕竟，每一次对话背后都是大量的运营成本、计算资源的消耗。没有哪家企业能够长久扛下这种成本损耗。

正如中国市场上，消费互联网向产业互联网的发展一样，C端免费的个人应用终将走向B端的收费服务，也就是产业应用，才能在人口红利消失、各行各业降本增效的当下，真正创造价值。

赛事行至中场，这一场AI大模型之战的赛点已然清晰：技术之外，大模型做好垂直产业应用才是王道。

基于这样的洞见和对技术演进的判断，马上消费CTO蒋宁表示，近期马上消费将正式发布自主大模型，聚焦“自主动态强化学习能力的大模型(AIGC+RLHF)、多种模型组合式的AI系统、多模态音视频实时人机结合”三项核心关键能力，致力解决金融行业大模型在落地过程中的安全可控和隐私保护、基础设施能力建设等方面的关键问题。

(一)赛点：抢跑还是深挖？

近日，由知名数据公司IDC发布的首份AI大模型评估报告出炉，名为《AI大模型技术能力评估报告》，对百度、阿里、智谱等14家国内主流企业的大模型平台进行评比。

值得注意的一点，IDC这份《AI大模型技术能力评估报告》和其他不同的是，评估维度除了常见的“产品”、“服务”之外，还将“行业覆盖”这一点作为关键的评估维度。

但周观认为，该报告虽然详实而权威，但作为一个面向通用平台的能力评估，对于各个垂直产业选用AI大模型的参考价值并不大，至少对于金融、金融科技行业来说是如此。

其中的关键点在于，“行业覆盖”仅仅只是解决了有没有的问题，而不能解决“好不好用”的问题。

当然，该报告也正视了这一点，其指出，大模型的最终目的还是要落地于产业实践。再看阿里、百度等企业在行业上的评分优势，仍只是在于其过往积累的产业领域，例如阿里评分较高的在于电商、百度在于能源。

纵观全行业来看，金融由于其行业的特殊性和独特性，尤其对于风险和安全的可控性，目前仍未有哪家企业能够有底气拿出相应的杀手级应用。

至今仍被口口相传的是，年初彭博推出的金融行业大语言模型BloombergGPT，涉及500亿参数，这背后依赖于彭博社广泛的金融领域数据优势构建了3630亿个标签的特有数据集(363 billion token dataset)。

蒋宁也认为，金融行业天然有着数据密集型、技术密集型的属性，一直在探索数据资产化，挖掘数据价值，同时又面临着如银行线下网点的价值传递效率问题、用户体验问题，需要机构持续创新。

也就是说，对于金融行业来说，大模型的关键不在于跑得快，而在于挖得深。无论跑得多快，终究还是得回归行业本质，解决行业关键问题。

(二)难点：金融的特殊性与独特性

蒋宁分析认为，除了数据、技术问题之外，目前金融行业大模型应用主要面临四个关键挑战。

第一，关键任务和动态适应性。

关键任务往往关系到生命或重大资产，比如自动驾驶、银行存款，人工智能要做到100%的准确，并不容易。生成式人工智能大模型与工业界的判别式模型相结合的化学反应，目前尚无明显效果。同时，与AlphaGo的封闭系统不同，大模型要想做到越来越聪明，就要想办法在开放的体系里让群体力量贡献给模型，让尽量多的用户参与反馈，形成生态，对于金融行业来说，要想做到这一点还需要跨越巨大的行业鸿沟。

第二，个性化要求和隐私保护。

摒弃千篇一律的教条式服务，做到千人千面，大模型在为用户提供个性化体验的同时，又能确保用户隐私，这也是一个需要解决的问题。

第三，群体智能与安全可控。

一方面，也就是前面提到的有效数据集问题，中文网络世界的可用数据和有效数据，相比之下非常有限；另一方面，行业领域的数据往往是封闭的，存在巨大的“数据孤岛”，难以打破共享。蒋宁认为，如何设计一个跨行业、组织的数据共享、权益共享且安全可控的机制，同样面临巨大挑战。

第四，基础设施能力。

以ChatGPT为例，按照国盛证券的报告《ChatGPT需要多少算力》估算结果来看，GPT-3 训练一次的成本约为 140 万美元；再以 ChatGPT 在 1 月的独立访客平均数 1300 万来计算，每天光计算所耗费的电费就在 5 万美元左右，这不是所有企业都能够承受得起的硬性成本支出。

不仅如此，GPU、网络、机房等基础环境要针对大模型训练、推理等方面的需求做出相应的改造，才能发挥最大的效能。例如最近国内就有云厂商相继推出向量数据库、高性能计算集群等产品，适应企业大模型训练、推理的计算需求。

总结来看，垂直产业大模型的落地和应用，存在高成本、缺数据、缺算力、难以实现安全可控等诸多关键问题。和金融类似的，还有医疗、健康等行业，关乎钱袋子、资产安全，更关乎生命健康，也因此，这类垂直行业的容错率往往更低、对于技术落地的精度和安全性要求也更高。

(三)破局：应用为王，产业至上

针对这些行业痛点和难点，蒋宁认为，马上消费应该有自己的打法。

蒋宁指出，对于垂直产业来说，私有专属模型是较好选择，要聚焦“经济”、“安全”和“可控”的大模型一体化解决方案，强化大模型私域数据的领域微调、精调训练能力，并和外部企业形成生态互助，解决数据归档、脱敏、分层、评判价值等问题。

而作为金融科技的探索者和践行者，马上消费在金融大模型的落地应用上通过持续的技术积累，已经具备这样的优势和特点：安全可控、个性化决策和体验、持续学习。蒋宁透露，目前马上消费已经研发了实时人机决策模型、多模态大模型、数据智能模型等，并在内部正式上线测试。

这背后，马上消费希望帮助解决金融行业的三个通用问题：

首先，个性化的服务和极致用户体验。金融业务有高价值、低频的特点，很难提供个性化的体验。传统的做法是分层打标签，提供不同的产品，但标签是动态变化的，因此如何自动化地决策为客户提供自动化的体验，就需要产品与众不同。

其次，高效的价值传递效率。虽然金融是技术密集型、数据密集型行业，但目前线下网点还是为数不少，因为人工智能尚不能做到不出错，很多工作还要高度依赖人工操作。

最后，合规安全的决策智能，这与鲁棒性相关。所谓鲁棒性，是指在特性参数和系统内，维持某些性能的特性，例如金融行业尤为看重的合规、安全问题。

基于这三方面考虑，以及上万台的服务器，近千张的GPU卡，40PB的文字、声音、图片、视频等形式的数据，马上消费金融力求实现算力、算法、数据以及场景的闭环，并由此打造“三纵三横”的AI战略。

马上消费金融的“三纵三横”战略

所谓三纵，是指实时人机决策、多模态大模型、数据智能。例如，要解决工业界的鲁棒性问题，让人接手人工智能解决不了的1%的问题。而马上消费过去多年的实践，已经积累了海量的语言、文字、图片等素材，并围绕其进行了大量的训练，形成了一套完整的多模态的资产。解决数据智能的问题，背后离不开马上金融早已经构建起来的2000+个模型，可以为2亿多用户提供自动化的营销、风控等服务。

三横即是指持续学习、模型控制、组合式AI：确保让模型越用越聪明，同时更稳定、更安全可控。而不局限于单一模型，通过多种模型的组合应用，可以更高效解决问题。

据了解，目前马上消费的人工智能技术主要应用在三大场景：一是金融智能对话，实现实时人机协作、持续学习、可信安全合规；二是金融数字人，通过大模型+组合式AI多模态能力，实现有温度的数字人；三是金融服务的AI核心引擎，通过大模型的大脑与心理学的有机结合，实现有情感的人机互动体验。

蒋宁将这些实践和成果总结为一句话：“垂直领域的判别式模型与生成式模型等多种模型组合，构筑一个开放的持续学习、具备鲁棒性、合规安全的体系，才是大模型的真正落地，而不是一个模型靠几千亿参数去落地，我们将为之而努力。”

以应用为王。不久的将来，或许大模型垂直产业落地应用难的问题，终将破局。

大模型破局之战：赛点走到“产业应用”

相关内容