百川智能推出一站式大模型商业化解决方案

上证报中国证券网讯10月31日，百川智能推出一站式大模型商业化解决方案，即1+3产品矩阵(全链路优质通用训练数据，Baichuan4-Turbo、Baichuan4-Air两款模型和全链路领域增强工具链)。该方案能够帮助企业以最低成本实现效果最佳的私有化部署，并支持企业将专有数据与百川智能自用的全链路优质训练数据混合，对Baichuan4-Turbo、Baichuan4-Air两款模型进行调优和增强，实现了行业最高的96%多场景可用率。

目前，百川智能已与信雅达、用友、软通动力、新致软件、达观数据、华胜天成等多家行业生态伙伴，以及华为、中科曙光等硬件厂商，中国移动、中国电信、中国联通等运营商达成合作。

为了提高大模型在多个场景中的可用率，百川智能将自用的优质预训练数据、SFT微调数据、强化学习中的通用训练数据，以及自研的超参自动化搜索和调优技术、数据动态自适应配比技术等统一封装，打造了一套全链路优质通用训练数据方案。

由于Baichuan4-Turbo、Baichuan4-Air均为百川智能自研，所以这些优质通用训练数据与两者的数据分布高度一致。结合超参动态搜索和自适应配比等算法，与企业私有数据混合微调，显著提升了两个模型在多场景下的可用率，在金融、教育、医疗等场景下的专业细分任务平均可用率高达96%，位居行业首位。

值得一提的是，作为百川智能的首个MoE(Mixture of Experts)模型，Baichuan 4-Air首创了PRI(Pyramid、Residual、Interval)架构。与标准的MoE架构相比，Baichuan4-Air保持了MLP(多层感知机)和Attention(注意力机制)的内部结构不变，仅对混合专家MLP层的配置方式进行优化，通过合理配置专家数量和激活策略，能够更好地平衡计算负载，减少计算量，提高推理速度。在相同的训练数据下，Baichuan4-Air不仅时效率更高，性能也大幅领先于GPT4-style、Mixtral-style结构的MoE模型。

行情