王小川的百川智能发布全链路领域增强金融大模型,准确率超过GPT-4o

王小川的百川智能发布全链路领域增强金融大模型,准确率超过GPT-4o

(图片来源:钛媒体AGI编辑林志佳拍摄)

(图片来源:钛媒体AGI编辑林志佳拍摄)

“大模型六虎”加速内卷,百川智能公布金融垂直领域模型。

12月23日消息,钛媒体AGI获悉,王小川创立的通用 AI 公司百川智能今天发布全链路领域增强大模型Baichuan4-Finance。在高质量金融数据的基础上,通过行业首创自约束训练方案,Baichuan4-Finance实现金融能力和通用能力,极大提高金融场景整体可用性。其金融专业能力和场景应用能力大幅领先GPT-4o。

百川智能创立于2023年4月10日,由搜狗公司创始人、前CEO王小川创立,旨在打造中国版的OpenAI,构建中国最好的大模型底座,帮助大众轻松、普惠地获取世界知识和专业服务,并在医疗与行业领域应用落地。截至目前,百川智能已相继推出16款大模型,涵盖开源、闭源、学术科研、国产算力等多个维度。

今年10月31日,百川智能宣布推出包括Baichuan4-Turbo、Baichuan4-Air两款模型在内的一站式大模型商业化解决方案,即1+3产品矩阵(全链路优质通用训练数据,Baichuan4-Turbo、Baichuan4-Air两款模型和全链路领域增强工具链)。

如今,百川智能向金融领域提供全新的大模型产品。

具体来说,中国人民大学财政金融学院12月17日发布的金融评测体系FLAME以及国内主流开源金融评测基准FinancelQ上,Baichuan4-Finance均登上榜首。其中,FLAME-Cer评测结果显示,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率93.62%,大幅领先金融领域公认的综合实力最强的通用模型之一GPT-4o、国内首个开源中文金融大模型XuanYuan3-70B-Chat,超出GPT-4o近20%。

同时,百川智能打造了一套全链路领域增强方案,该方案覆盖了高质量数据集构建、模型预训练、微调、强化学习等从模型研发到场景应用的全流程。同时,Baichuan4-Finance还在领域自约束训练过程中引入了更高精的通用数据,与高质量金融数据一起进行混合训练,最终实现了模型通用能力不下降,金融能力稳定增长的效果。此外,百川智能在后训练环节也做了大量增强工作,如:通过合成数据、指令数据对模型进行有监督的微调;在强化学习策略中,针对数学计算等金融领域特别关注的场景进行样本增强等,进一步提升了模型性能。

同时,百川智能打造了一套全链路领域增强方案,该方案覆盖了高质量数据集构建、模型预训练、微调、强化学习等从模型研发到场景应用的全流程。同时,Baichuan4-Finance还在领域自约束训练过程中引入了更高精的通用数据,与高质量金融数据一起进行混合训练,最终实现了模型通用能力不下降,金融能力稳定增长的效果。此外,百川智能在后训练环节也做了大量增强工作,如:通过合成数据、指令数据对模型进行有监督的微调;在强化学习策略中,针对数学计算等金融领域特别关注的场景进行样本增强等,进一步提升了模型性能。

商业化层面,目前,百川智能已经服务了数千家客户,包括北电数智、完美世界游戏、爱奇艺、360集团、生学教育、爱学堂等各行业的领军企业,并且与信雅达、用友、软通动力、新致软件、达观数据、华胜天成等多家行业生态伙伴,以及华为、中科曙光等硬件厂商,中国移动、中国电信、中国联通等运营商达成合作,携手构建百川大模型生态。

用友表示,Baichuan4-Finance凭借其海量的金融专业知识储备,在财税知识问答场景中,准确率较Baichuan4-Turbo提升了20%,较GPT-4o提升了10%,表现尤为亮眼;软通动力表示,自部署Baichuan4-Finance以来,其客户满意度提升了20%。

事实上,百川智能已经转向行业模型领域。百川智能创始人、CEO王小川早前表示,AGI 正在产生巨大的突破,但目前百川没有达到世界级的水平,只是有一定成绩,对自己来讲有 60 分吧。主要今天在现实和理解中得找到自己的一条道路,百川认为自己已经打明牌了,有实践的路径。

“定义什么是 AGI,其实有很多行业讨论,大家不断在上面加码。之前我们讨论‘机器怎么才算有智能?’以前是图灵测试,对话者分辨不出来是人还是机器,这就算智能了。到了今天,机器还要会解数学题,还要有主动学习的能力。我理解 AGI 是做到“像人一样”,像一个数字员工,能够在多个职业里产生工作成果。之前和一个技术大佬交流,他质疑当下的大模型,他说大模型七位数乘法都做不好。我反问‘你会吗?你拿着科技公司的股份,你也不会七位数的乘法,你为什么要求 AGI 会?’这是个审美问题,我们以前总是把 AGI 当成一个工具,它是超级计算机,能精确地做计算,或者跑程序跑得很快。但 AGI 本身,我觉得就像人一样,如果审美没有建立好,你怎么去评价它呢。AGI 正在产生巨大的突破,它的文章已经写得像最顶尖的文科生了,还可以写诗,随着 OpenAI o1 的推出,AI 有了更好的逻辑推理能力,文理双修。但它并不是上帝,它像一个极其聪明的人,但它现在真的知道宇宙规律吗?”王小川表示,AGI 现在还在飞速发展中。往后还有新的突破,发展速度并没有变慢。大家都过高期待这两年的速度,也许三五年后,就会非常不一样。而今天我们从互联网时代走入到了 AI 时代,他感觉很幸运,没有错过每一个时代。

对于 AI 搜索,王小川表示,虽然这能走出百度射程,甚至能够颠覆百度,但它依然在字节产品的射程里。“从竞争角度,在大厂的 DAU(日活跃用户)范畴内,我们还是处于弱势地位,在很多地方也搞不过小公司,他们对于需求敏感度的把握,会把腰部公司撕的粉碎,他们有很强的竞争力。反过来,医疗领域大家都认为是垂类,小公司不一定做的动,虽然上一代已经投了 1000 亿进去,投资人很多都失去信心了,但投资还在持续加大。”

王小川强调,医疗绝不只是垂直方向,它不仅与 AGI 是等价的,还代表着生命科学的未来想象。

“我们从今天的智能时代走向生命时代,可能会越走越广阔,医疗是当下特别好的,独有的一个卡位,但我相信在三年、五年后,大家会看到它不是个垂直方向,它可能代表更广阔的未来。”王小川称。

(作者|林志佳,编辑|胡润峰)

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载