毫无疑问,以ChatGPT为代表的AI大模型是今年科技圈乃至社会范围内最为引人关注的领域,OpenAI网站的流量在4月份就超过了18亿,进入了全球流量排名前20。然而,根据网络分析公司Similarweb公布的数据显示,在狂飙半年后,ChatGPT的访问量首次出现负增长,6月份的访问量环比下滑9.7%。大模型狂飙200多天后,国内外探索者们的心态,从理想亢奋开始回归现实落地。在7月7日华为盘古大模型3.0的发布会上,华为云CEO张平安更是直言,“盘古大模型没有时间作诗和聊天。参数再多、对话能力做得再好,但如果解决不了实际问题,也没有多大用处。”通用大模型作为整体产业发展的基础,其价值与地位无需赘言。而最近行业大模型和AI infra(AI架构)开始更多地被提及,前者解决的是大模型应用的问题,包括计算、存储、网络等在内的AI infra则代表着大模型发展的基础设施,二者将直接推动大模型的落地和应用。是部署一个超级大模型,期待它能够把能力上升到一定程度,还是应该从实际解决问题出发,部署一堆专业模型,让它们各司其职,这涉及两种截然不同的思路。通常来说,大模型训练的基础因素为数据质量与计算资源。企业要想得到一个效果好的行业大模型,保证数据质量尤为重要。如果导入的行业数据质量低、不系统、未经过清洗和预处理,则训练出的模型不可避免会有问题。充足的计算资源同样不可或缺,不然就会影响整个运行流程的速度和效率。不过,不同于通用大模型,产业大模型对行业参与者则提出了不同的门槛和要求,即要求操盘者具备丰富的产业应用实践场景。毕竟模型100%会犯错,一味地追求算力和数据并不能解决这个问题,因此模型之上必须要有运营兜底机制,让模型的输出和操作从不可用变成可用,并且能做到知错就改,形成反馈闭环和迭代。“人工”才能衍生“智能”。同时,大模型落地更关键的是要围绕用户与客户价值的体验升级与业务发展。人工智能需与企业数智化转型一致,业务驱动是核心原则,围绕业务发展扫描数智化洼地,规划人工智能应用案例,获取业务价值,并形成迭代优化,扩大AI应用范围的闭环。目前的大模型如果要深入应用到具体行业,依然有很长的一段路要走。以工业为例分析,工业场景中的很多数据是不可读取的,或者即使读取了也需要一个翻译和解读的过程,而且工业制造细分领域众多,没有海量数据标签,极难形成类似GPT的通用大模型。在数据之外,工业领域对安全、稳定、可靠等指标极其严苛的追求,目前的生成式AI无法满足。从这个判断出发,当下如果要发展面向垂域的大模型,要注重发展通用大模型的外围插件,采取大模型和知识图谱、传统知识库相结合的策略。“2023大模型之选”由DBC联合CIS、CIW发布,旨在遴选当前国内大模型领域具有代表性与创新力的产品、案例与组织,并展现其独特价值,给行业以参考。借助自研的“iFuture+iPower’混合模型,”遴选机制重点考量技术实力、业内口碑、成长性、品牌力以及创新案例五大方向。为中国大模型产业的横向与纵深发展献策献计,助力大模型落地与创新突破。