lsBench(48.2 vs. 30.0)等主要编程基准测试中,均全面超越前代开源旗舰 Qwen3.5-397B-A17B。同时,其也大幅领先于同规模的稠密模型。在推理任务上,Qwen3.6-27B 在 GPQA Diamond 上取得了87.8的成绩,可与数倍于其规模的模型相媲美。  
当前文章:http://ynmenb1.kaishenlu.cn/rypm32/fbfhap4.xls
发布时间:04:06:04
© 1996 - 蜘蛛资讯网 版权所有 联系我们
地址:北京市三里河路52号 邮编:100864