腾讯发布开源MoE大语言模型Hunyuan

热点 2024-12-24 07:53:33 7273

11月5日消息,腾讯腾讯今日宣布推出业界参数规模最大、发布效果最好的开源开源MoE大语言模型Hunyuan-Large。

Huanyuan-large模型的模型总参数量为389B、激活参数为52B、腾讯训练token数量为7T、发布最大上下文长度为256K、开源词表大小为12.8w。模型

腾讯发布开源MoE大语言模型Hunyuan

在技术创新方面,腾讯Hunyuan-large通过高质量的发布合成数据来增强模型训练,弥补了自然数据的开源不足。

其中,模型该模型预训练支持处理高达256K的腾讯文本序列,大幅提升了长文本上下文的发布处理能力,能够更高效地完成长文本任务。开源

据了解,Hunyuan-large在CMMLU、MMLU、CEva1、MATH等多学科综合评测集上表现优异,在中英文自然语言处理、代码生成、数学运算等9大能力维度中全面领先,超越了Llama3.1和Mixtral等一流开源模型。

此外,腾讯还宣布将推出自研的长文评测集“企鹅卷轴(PenguinScrolls)”,以填补行业在真实长文评测集上的空白。

企鹅卷轴基于公开的金融、法律、学术论文等长文本构建,文本长度从1K到128K不等,覆盖深度阅读理解和长文推理任务。

本文地址:http://954af.ahlulin.com/news/87e67699236.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

全站热门

[流言板]邮报:据信萨卡是腿筋撕裂,甚至有可能会伤缺至3月初

全市场:佛罗伦萨选择性买断1200万欧引进阿德利,最快周三体检

周通社媒:世俱杯与拜仁、博卡、本菲卡同组让人兴奋,2025美国见

罗马诺:切尔西在与奥斯梅恩的团队进行谈判,球员不打算降薪

业界首个 教育数字化泛在操作系统发布

罗马诺:乌加特得到通知,他当地时间周二晚上可以飞往曼彻斯特

记者:求购拉姆斯代尔失败后,狼队将加大力度追逐约翰斯通

[流言板]英格拉姆在因右跖肌腱炎缺席5场比赛后,可以出战对阵太阳

友情链接