昨天,以「智变加速,产业焕新」为主题的2023腾讯全球数字生态大会于深圳国际会展中心18号馆盛大开幕。
本次大会上,腾讯混元大语言模型正式亮相,并宣布通过腾讯云对外开放。这是腾讯首次披露的通用大语言模型,具备强大的中文创作能力、复杂语境下的逻辑推理能力,以及可靠的任务执行能力。
此前的大半年,国内云厂商跟随ChatGPT,掀起“百模大战”。一时间,国内生成式大语言模型多得让人眼花缭乱。腾讯在市场激流勇进之后再“秀肌肉”,也映射了“混元”这个取自典籍的名字中“元气生于混沌之中”的含义,它拨清迷雾,迎接新天地。
腾讯为什么此前不着急发通用大模型?在蛰伏的日子里,腾讯做了什么?腾讯混元大模型值得期待吗?
其实,在市场看不见的日子里,腾讯已经在大模型底层能力上埋头钻研多年。从2021年开始,腾讯先后推出千亿和万亿参数的NLP稀疏大模型,打破CLUE三大榜单纪录,实现在中文理解能力上的新突破。
在去年年末ChatGPT掀起大模型浪潮后,腾讯的大模型路线也稳扎稳打,利用自身多元且丰富的产品、数据、场景的优势,迭代了多个版本。腾讯的大模型在丰富的内部场景和应用上进行了反复锤炼,更清楚一个深入业务的大模型应该如何设计和研发。
相比于国内外已发布的大语言产品主要是通过聊天场景进行测试和训练,腾讯选择了用自家产品来测试,依托于腾讯20多年的发展历史,积累了海量的用户和丰富的产品矩阵,这些都成为了混元大模型语料训练的“养料”,也是场景应用的“磨刀石”。至今,腾讯混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens。
基于此,腾讯在本次全球数字生态大会上正式宣布,混元大模型将作为腾讯云MaaS服务的底座对外开放,客户不仅可以直接通过API调用混元,也可以将混元作为基底模型,为不同产业场景构建专属应用。
据了解,腾讯混元大模型在技术上坚持自主创新策略,从第一个token开始训练,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。
腾讯集团副总裁蒋杰表示,混元大模型更加聚焦将技术应用于实际场景,助力行业创新。混元大模型已作为核心引擎,支持了公司包括腾讯会议、腾讯文档、腾讯广告在内的50多个应用,腾讯已经进入了“全面拥抱大模型”时代。未来,混元还将持续迭代、终身学习、不断提升技术能力。
此外,蒋杰还具体展示了腾讯会议、腾讯文档、腾讯广告等多个业务接入腾讯混元大模型后的实际应用情况。
比如腾讯会议基于混元大模型开发的AI小助手,只需要简单的自然语言指令,就能完成会议信息提取、内容分析等复杂任务,会后还能生成智能总结纪要。
据实测,在指令理解、会中问答、会议摘要、会议待办项等多个方面,混元大模型均获得较高的用户采纳率,相较于GPT3.5有明显的优势。
在文档处理方面,腾讯混元大模型支持数十种文本创作场景,能够一键生成标准格式文本,熟悉上百种Excel公式,支持自然语言生成函数,并基于表格内容生成图表。
在腾讯看来,混元大模型的想象空间远不止目前呈现给公众的效果。像人类一样,它能持续训练、终身学习,训练数据集会持续更新,不断学习更新最新知识,以改善其性能和准确性。
而大模型作为MaaS的核心,通过叠加数据标注、模型管理、部署等云服务工具,构成MaaS平台。大模型的的进一步发展,使得Maas平台可以在信息搜集、数据分析、辅助决策、内容创作等方面为用户提供支持,有望实现更多新领域的应用场景;同时,MaaS平台通过调用IaaS层的数据库,使得PaaS层可以基于MaaS平台针对企业客户的个性化需求进行定制开发,进而形成全新的“SaaS+MaaS”的订阅模式等。如今,云计算在大模型驱动下具备了更强的集成能力,通过将大模型嵌入算力、算法和应用层,实现把算力、模型和场景应用集成为标准化AI产品统一对外输出,这也将是未来数智经济的重要发力点。