大咖说｜大模型赛道“争鸣”：场景、路径和评估的多重挑战

ChatGPT的爆火出圈，让大模型走出专业领域，进入更普适的圈层，并引发更多人关注和思考这项技术究竟会如何影响人类社会。最终全社会形成共识：这是一项革命性技术，将充分释放智能生产力，推动人类社会进入到一个全新AI时代。商业机遇来临，谁能率先把握住风口，意味着谁将在下一轮市场竞争中取得优势占位。今年以来，神州数码也积极拥抱大模型带来的全新变化，时刻关注技术发展动态，升级自有知识产权产品，加速布局人工智能算力等领域，切实抓住AIGC时代变革机遇，谋求全新发展。

在刚刚结束的2023数字生态大会上，神州数码副总裁、CTO李刚受邀出席，与多位行业专家就大模型技术的深入应用以及模型评估等话题，进行了深入探讨。本文就李刚讨论内容进行整理编辑，希望能给火爆市场一些启发和思考。

大模型发展需重视Native场景避免路径依赖

大模型与其他新技术出现以后，大家第一反应都是“+”，“大模型+”这个说法并不新鲜，因为之前有互联网+，所以大家从这个角度直接切入是很自然的。

大模型是百年来颠覆性的技术范式转变，我认为它真正的应用场景还没有出现，“+”的场景不是最好的场景，以前互联网爆发的时候，最后跑出来的都是互联网Native的应用，大模型真正的应用场景也应该是Native的场景。我们寻找Native场景，要避免路径依赖，也就是要避免模仿以前的模式和路径来探索大模型的应用场景。

目前大模型技术还没有完全成熟，我们还看不到它未来的发展顶点在哪儿。我认为要关注一个非常大的、Native的场景是多模态，在企业里面，多模态几乎是没有人去想，那多模态会出现什么场景，这个是要关注的。神州数码关注大模型的时候，首先成立了一个追踪团队，组织一帮人关注行业动态，看论文写周报，如果论文内容可验证就第一时间进行验证。其次是做敏捷，模型要想在企业里面用，需要做出一套敏捷平台，让企业去试，同时把客户Involve进来共创。我们现在已经签了一些共创客户，让客户使用敏捷平台，在共创过程中去摸索最适合的场景。最后作为一个科技企业还是要第一性原理，两头跟住，一方面是研究的跟进，一方面是场景的跟进。

大模型评估专业又前沿注重知识本身和涌现能力

大模型评估本身就是一个非常前沿的领域，虽然现在已经有一些评估方法和标准出现，但站在企业角度，这些方法和标准还不够，所以模型评估本身就是一个研究方向。

目前行业里做模型评估主要围绕两点进行，针对外部模型进行评估，主要是通识能力评估，包括知识本身和涌现能力两部分。在行业大模型方面，它的行业知识评估相对简单，但行业涌现能力，是一个专业性很强的话题。举个例子，我们在金融行业做了一个行业大模型，它的涌现能力是什么呢？通用大模型的涌现能力，比如我们给它一道奥数题，它能够解出来，这就很厉害了。

行业大模型一般来说是通过通用大模型做全参，或者是做fine-tuning，做好了以后出来的这个大模型叫行业大模型。这个做好了以后，是不是说通用能力加行业知识等于行业涌现能力？这是个问题。我们讲风控，如果不是风控应用，而是行业大模型直接提供风控能力，这就是一个非常大的涌现出来的能力。它不是说只是看到了这些东西，他会直接对业务做一个风控评价，那这个就很难。

传统来说，都是用传统的机器学习做成的小模型来做，能不能泛化到大模型里面去做？这个是涌现出来的吗？这就非常难。所以现在是一个选择和共创的问题，选择愿意在大模型里面跟我们一起做研究的，大家一起探索、共创。

本文来源于DOIT传媒，文章内容仅供参考，不构成投资建议。