短短两个月,分化已经出现。
在5月23日举办的文心大模型技术交流会上,百度智能云AI与大数据平台总经理忻舟介绍:“文心千帆大模型平台,是百度提供给客户的企业级大模型生产平台,不但提供包括文心一言在内的大模型服务及第三方大模型服务,还提供大模型开发和应用的整套工具链。”
即文心千帆可以文心一言为核心,提供大模型服务,帮助客户改造产品和生产流程;企业也可以在文心千帆上基于任何开源或闭源的大模型,开发自己的专属大模型。
多位与全天候科技接触的业内人士认为,当前国内大模型赛道主要包括三类:一类对标GPT的通用大模型,聚焦基础层的公司;一类是在开源大模型基础之上训练垂类大模型,聚焦垂直行业的企业;另一类则是专注具体应用的纯应用公司。
“刚开始大家是一窝蜂扎进通用大模型,现在分化已经出现,不管是分化到具体行业的,还是不做研发直接调用接口做产品运营的,这个趋势是越来越清晰了。”前金山软件副总裁兼人工智能事业部负责人、现AI领域创业者李长亮告诉全天候科技。
通用大模型面临算力需求大、训练和推理成本高、数据质量不佳等挑战。一个成功的且可对外商业化输出的通用大模型大模型,要求厂商拥有全栈大模型训练与研发能力、业务场景落地经验、AI安全治理举措、以及生态开放性等核心优势。
在百度智能云副总裁朱勇看来,基础模型(通用大模型)的公司可能“只有那么几家”,但是上面会长出很多专业领域的大模型。
“训练一个基础模型,成本是非常高的,做一个千亿级的大模型,需要单机群万卡以上的算力。”朱勇说,从国内外来看,真正做通用模型的公司并没有那么多。相反,训练领域(垂类)模型所需要的代价和资源远远小于从零开始做通用模型。
因而,从商业逻辑的角度来看,大部分公司不具备做通用大模型的能力,巨头更适合做通用大模型,拥有丰富场景数据积累的公司更适合做垂域模型。
垂类大模型以深度解决行业需求为主,即企业在自己擅长的领域训练适合自己的“产业版GPT”。这类大模型生成的内容更符合特定垂类场景的需求,质量更高。
当前,已经可以看到不少垂类模型应用在金融、医疗、交易等场景中。比如,彭博社根据自身丰富的金融数据资源,基于GPT-3框架再训练,开发出了金融专属大模型BloombergGPT。
除了上述两种常见的模式,目前国内大模型创业赛道上还有一种专做应用的公司,它们没有研发团队,从现有大模型调用接口,做产品和运营。