财经 > 正文

阿里云发布通义千问2.5大模型开源通义千问1100亿参数模型

2024年05月09日 13:47:54 来自广东

通义大模型发布一周年之际，5月9日，阿里云正式发布通义千问2.5大模型，并开源通义千问1100亿参数模型。

记者了解到，通义千问2023年4月问世以来，始终专注于基础模型的技术研发，从初代模型升级至2.5版本。相比上一版本，2.5版模型的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。

一年间，通义发展出了文生图、智能编码、文档解析、音视频理解等能力，企业客户和开发者可以通过API调用、模型下载等方式接入通义，个人用户可从APP、官网和小程序免费使用通义。同时，原通义千问APP于今天正式宣布更名为“通义APP”，将通义大模型全套能力集于一身，致力于成为“通情达义”的AI助手。

通义正在成为最受中国企业欢迎的大模型之一。根据最新数据，通义通过阿里云服务企业超过9万、通过钉钉服务企业超过220万，现已落地PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

坚定开源路线

通义是大模型开源积极的推动者和实践者。去年8月，通义宣布加入开源行列，随之启动开源，沿着“全模态、全尺寸”开源的路线，陆续推出十多款开源模型。目前，通义开源模型下载量已经超过700万。

为顺应不同场景用户的需求，通义推出参数规模横跨5亿到1100亿的八款大语言模型，小尺寸模型如0.5B、1.8B、4B、7B、14B，可便捷地在手机、PC等端侧设备部署；大尺寸模型如72B、110B能支持企业级和科研级的应用；中等尺寸如32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。此外，通义还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。

通义72B、110B开源模型都曾登顶Open LLM Leaderboard榜首。在开放研究机构LMSYS Org推出的基准测试平台Chatbot Arena上，通义72B模型多次进入“盲测”结果全球Top 10。

阿里云CTO周靖人表示，开发者的反馈和开源社区的生态支持，是通义大模型技术进步的重要助力。未来通义大模型还会持续开源。

百炼平台升级支持企业RAG

百炼平台也已从模型开发、应用开发到算力底座实现2.0全面升级，更加易用、更加开放，引入更多模型，还率先兼容LlamaIndex等开源框架，企业可自由替换能力组件来适配自身系统。针对当下企业最关注的RAG链路，百炼提供灵活开放的企业级检索增强服务，5到10行代码即可搭建RAG应用，让大模型拥有“最强外挂”。

2023年10月，阿里云发布了百炼大模型平台，开发者可通过“拖拉拽”5分钟开发一款大模型应用，几小时“炼”出一个专属模型，把精力专注于应用创新。

阿里云CTO周靖人表示：“当下企业应用大模型存在三种范式：一是对大模型开箱即用，二是对大模型进行微调和持续训练，三是基于模型开发应用，其中最典型的需求是RAG，以企业数据对大模型进行知识增强。围绕这些需求，百炼打造了模型中心和应用中心，提供最丰富的模型和最易用的工具箱。”

今日，小米旗下的人工智能助手“小爱同学”与阿里云通义大模型达成合作，强化其在图片生成、图片理解等方面的多模态 AI 生成能力，并在小米汽车、手机等多类设备落地；微博、众安保险、完美世界游戏等企业也宣布接入通义大模型，将大模型应用于社交媒体、保险、游戏等领域。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

阿里云发布通义千问2.5大模型开源通义千问1100亿参数模型

亲爱的凤凰网用户:

第三方浏览器推荐:

阿里云发布通义千问2.5大模型 开源通义千问1100亿参数模型

亲爱的凤凰网用户:

第三方浏览器推荐:

阿里云发布通义千问2.5大模型开源通义千问1100亿参数模型