您的位置:首页 >新闻 >

云知声千亿参数山海大模型首次亮相 C-Eval评测70分

2023-08-30 18:47:58    来源:DoNews

DoNews8月30日消息,8月28日,云知声旗下山海大模型迎来又一次迭代升级,当前版本参数规模达到千亿,实现了多学科能力、医疗能力双提升,实测性能在C-Eval全球大模型综合性评测中超越GPT-4,以平均分70分的成绩进入前三甲。


(相关资料图)

C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含13948道多项选择题,涵盖数学、物理、化学、生物、历史、政治、计算机等52个不同学科和四个难度级别,是全球最具影响力的综合性考试评测集之一。作为第三方发起的测试基准, C-Eval以其客观性、公正性备受业内关注,也吸引了多家企业、机构和高校的参与。

据悉,本次山海大模型2.0版参数规模达到千亿,增加了更多的学科类的预训练语料,训练数据(Tokens)达到两万亿(2.0T)。

在本次模型升级过程中,山海团队充分利用了教材、文献、百科类语料的价值,这些语料包含了人类对客观世界知识的丰富理解、详尽解释以及在各个领域的深入研究所得到的科学结论。不同的学科领域的数据涵盖了各自学科的专业知识,这在一定程度上弥补了第一版山海大模型在某些专业领域的知识盲区。

为了使模型能更科学合理地汲取这些不同领域和来源的数据中的知识,山海大模型团队使用了DoReMi方法对数据进行了优化权重采样。

通过这种策略,可以在较大范围内均匀并深入地提取各类信息。这一策略使得山海团队在本次模型升级过程中,能更有效地吸取和运用各种知识,使模型的知识库更加全面。

云知声深耕医学领域多年,山海大模型2.0在预训练阶段使用了海量的医学病历、医学教材、临床指南和医学文献等数据,并在对齐阶段使用了人机结合方法构建的近百万级的病历理解、医学考试和医学知识问答等指令学习数据。

C-Eval中医疗学科的结果表明,山海大模型2.0在基础医学、临床医学和医师资格数据集上都能获得接近90分的水平,为业内最高。

云知声山海大模型团队参加了刚刚在沈阳结束的CCKS2023-PromptCBLUE评测,该评测是当前最权威的中文医疗大模型的评测榜单,我们同样也取得了第一名的成绩,再次证明了山海大模型专业的医学能力。

山海团队发现,在运用位置插值(Position Interpolation)方法进行大幅度扩展时——比如将窗口从4k扩展到32k——其性能会显著受到影响。这种影响主要体现在短距离情况下的使用。

为了更好地解释这一点,假设原始数据中距离为1的两个token,当我们将数据从4k扩展到32k时,这两个token之间的距离实际上变成了1/8。

这就意味着,在进行位置插值的过程中,原本距离很近的两个token之间的距离被大比例地拉远了。这种场景下,衰减规律在短距离的使用会受到较大的影响,这是因为衰减规律在短距离时可能具有非常突出的变化率,意味着原本应该很近的两个token在大规模扩展之后,它们之间的关联性会大幅度减小。

因此,直接进行位置插值的方法会使得窗口大幅度扩展后的性能较大程度地降低。发现RoPE位置编码短距离之间的差异,主要体现在高频分量上,长距离之间的差异,主要体现在低频分量上。

山海大模型2.0版根据神经正切核的思想,采用Neural Tangent Kernel (NTK)的非线性差值方法,实现高频外推、低频内插的大规模长度扩展。采用NTK扩展后模型能够更好的支持文本窗口扩展,当前山海大模型2.0版本已经支持32K的窗口长度。

在大多数行业中,对大模型的并发使用和响应时间有很高的要求。这要求我们在保证大模型算法效果的基础上,更需要深思其推理速度。

本次山海大模型2.0基于落地场景需要,设计了受限解码方法,在解码过程中不需要计算整个词表的概率,只需关注落地场景下关注的token,极大地提高了解码效率。如图所示,利用受限解码方法,生成token“今”后面只需考虑token“夕”和“天”的概率,而不需要完成整个词表概率分布的计算。

作为中国AGI技术产业化的先驱之一,云知声于2016年开始打造Atlas人工智能基础设施,并以此为基础,构建云知大脑(UniBrain)技术中台——以山海(UniGPT)通用认知大模型为核心,结合多模态感知与生成、知识图谱、物联平台等智能组件,为云知声智慧物联、智慧医疗等业务提供高效的产品化支撑,持续推动“U(云知大脑)+X(应用场景)”战略布局,践行“通过通用人工智能(AGI)创建互联直觉的世界”的公司使命。

山海大模型作为云知大脑的核心,能力体系涵盖语言生成、语言理解、知识问答、 逻辑推理、代码能力、数学能力等。此外,为提高大模型在具体场景的应用落地水平,山海大模型在通用能力基础上,增强物联、医疗等行业能力,致力为客户提供更智能、更灵活的解决方案,加速千行百业的智慧化升级。

标签:

相关阅读

精彩放送

中创新航上半年纯利约为1.47亿,同比下降12.1%

高途发Q2财报:营收7.03亿元 同比增长30.7%

荔枝集团发Q2财报:营收5.93亿元 同比增长15%

柯马发布新型可穿戴外骨骼MATE-XB 能协助搬运重物

中通快递发Q2财报:营收97.4亿元 不及预期

国轩高科上半年净利润增长224%,海外营收增长近3倍

欢聚集团发Q2财报:净盈利同比增长89.1%

敷尔佳发上市后首份财报:上半年归母净利润3.54亿元

减税、降费、让利、惠民 多项活跃资本市场政策发布

强强联手!滴滴将向小鹏汽车出售智能电动汽车相关资产和研发能力

网传“自9月1日起卷烟涨价”,中国烟草总公司辟谣

滴滴向小鹏汽车出售智能电动汽车相关资产和研发能力

江淮汽车:上半年营收同比增长25.87%,扭亏为盈

五菱汽车:上半年总收入为50.89亿元

比亚迪电子:拟158亿元收购捷普电路旗下子公司所有股权

《星之海洋2R》制作人解释画面并非HD-2D技术

证券交易印花税实施减半征收;哈弗H6车型全球累计销量突破400万;电影《学爸》总票房破4...

传祺M8新增车型上市,座椅布局2+2+3,增配座椅功能,售31.98万

山东日照经开区出访日韩务实推进项目招商合作

光大证券:印花税减半、融资保证金最低比例降,反弹“发令枪”已打响

安东油田服务(03337)发布中期业绩,净利润1.03亿元,同比增长16.8%

亿晶光电:上半年营收 43.65 亿元,净利润 2.85 亿元同比增长 1106.64%

公安县警方破获一起“老虎机”赌博案 涉案金额106万元

740亿北向资金“撤退”路线:电子、银行、食品饮料

净利润跌超40%,天工能救昆仑万维?

崇信:早熟苹果“甜蜜来袭”

海通策略:目前市场已经到达底部区域 后续政策落地见效有望推动市场见底回升

比亚迪唐新车售价正式发布 25万元起

国家统计局:1—7月电力、热力生产和供应业利润总额同比增长51.2%

四川再添一个高等级科技创新平台 看中国装备科技城新布局

中关村互联网3.0产业园揭牌

双色球怎么玩规则是什么_双色球怎么玩

闻泰科技:上半年营收292.06亿元同比增加2.49%,净利润12.58亿元

新乳业:公司奶源供应稳定可靠,产品丰富,供应充足,消费者可通过线下、线上渠道方便购买

智元“爬坡”,人形机器人艰难落地

合肥新桥国际机场T2航站楼混凝土主体结构封顶

西南科技大学吧古驰(西南科技大学吧)

如何停止大脑不受控制的胡思乱想(大脑老是胡思乱想控制不了怎么办)

事关医院、养老院的消防安全 这些隐患要注意

米家生态用户福音!仅需189元,小米AX3000T全屋WIFI覆盖不是梦

恒大汽车上半年减员减薪,总员工成本同比降逾六成

这件民生实事办了!349名学子获慈善助学

成都车展开幕;多家互联网公司发布财报;茶颜悦色就公众号推文致歉|Do早报

恒大汽车上半年业绩:亏损68.73亿元

张家界:情暖校园 共享书香

广汽集团半年报:净利润约29.66亿元

紫光国微半年报:营收37.35亿元,同比增长28.56%

东方甄选2023财年报告:全年带货GMV达100亿元,抖音总订单数1.36亿单

阿里云开源通义千问多模态视觉模型Qwen-VL

零跑汽车上半年报告:交付44502辆同比减少14.4%,营收58.13亿元

逆水寒手游无间之境怎么获取

中兴商业:上半年归母净利润5216.66万元 同比增长117.52%

上海网信办指导多家网络企业加强个人信息保护合规工作

2023年8月25日上海市EDTA四钠价格最新行情预测

御龙在天历练功勋可以换80装备(御龙在天历练功勋)

Keep首次披露半年报,自有品牌运动产品实现收入 4.66 亿元

8月中旬21个城市5大品种钢材社会库存963万吨 环比降0.1%

首发云鲸扫拖机器人J4,解构云鲸智能的长期主义

若羽臣2023上半年财报公布,净利润增长147.61%

9月30日前,阿里云将关停代销业务

把10款市场最热销的紧凑型轿车拆成10万个零件,哪个品牌用料缩水?

足银999多少钱一克(2022年8月25日)

赤子城发中期业绩:股东应占利润1.85亿元,同比增长124.1%

奇安信发布Q-GPT安全机器人和大模型卫士

华为与爱立信签订长期全球专利交叉许可协议

富达_关于富达介绍

东鹏饮料登榜“全球软饮料品牌价值25强” 彰显民族品牌风采

高合汽车与中国邮政储蓄银行信用卡中心签署战略合作

快狗打车发布中期业绩:营收3.72亿元,同比增长6.6%

精心建设特教学生的新“家”!贵阳市盲聋哑学校新校区竣工交付的背后

科大讯飞:轻舟已过万重山

长安汽车泰国子公司成立,计划2030年海外市场年销量突破120万辆

华为彭松:2025年前实现网络L4自动驾驶,2030前后实现L5

场务人员是做什么的

我省成北斗技术创新核心策源地

2023新安县最低工资标准每月多少 新安县最低生活标准是多少

国产处理器公司海光信息上半年利润大涨 42%

华住集团:二季度营业额同比增长72% 净利同比扭亏为盈

亿纬锂能:上半年净利润21.51亿元 同比增58.27%

紫光股份发半年报:营收同比增长4.8% 净利同比增长6.5%

把握时代发展趋势,2023艾睿户外经销商大会暨新品发布会圆满举办!

Meta推出AI编程工具Code Llama

涉案5.03亿元!西安警方破获一起特大洗钱案

AMD收购法国初创公司Mipsology

网传AI公司商汤科技再次裁员:赔偿N+2

九号公司:上半年归母净利润同比下滑12.97%

忻州:路边停车实行收费,一市民发布感谢信!

中材国际:拟公开发行不超20亿元公司债

京东方内侧折叠中国电子行业标准发布

微博Q2营收31.4亿元 同比增长5%

移卡发布中期业绩 收入同比增长25.6%至20.62亿元

有道Q2净收入12.1亿元 同比增长26.2%

云米上半年营收13亿元 同比下降20%,经调净亏损5370万元

山洪预警!四川等7省区部分地区可能发生山洪灾害

蚂蚁集团“创新科技总部”落地海淀

平安健康发布2023年上半年业绩:营收22.2亿元

微博Q2营收4.4亿美元 调后净利润1.26亿美元 同比增长23%

网易Q2营收240亿元,经调净利润同比增67%

万物云发布2023年中期业绩:营收同比增长12.5% 净利同比增长15.7%

网易云音乐发上半年财报:经调整净利润3.32亿

全民减负 《刀剑online》减负版9月1日轻松上线

世纪互联Q2营收18.2亿元 净亏损2.329亿元

瑞声科技:上半年净利1.5亿元,同比下降57.1%

老板电器:上半年度净利润约8.3亿元,同比增加14.67%

消息称三星9月披露自家类ChatGPT生成式AI细节

Arm要出货一万亿枚芯片,IPO后将成为软银“命根子”

百世集团公布2023年二季度业绩 快运、供应链实现盈利

中金辐照8月24日快速反弹