美團發(fā)布并開源混合專家模型:5600億參數(shù) 只激活5%就有奇效
在COLLIE(中文指令遵循基準)和 Meeseeks-zh(中文多場景指令基準)中成績分別為 57.10 和 43.03
。美團LongCat-Flash-Chat在僅激活少量參數(shù)的發(fā)布前提下,性能就可以比肩當下領先的并開主流模型,LongCat-Flash在TerminalBench(終端命令行任務基準)中
,源混有奇在τ2-Bench(智能體工具使用基準)中的合專活%表現(xiàn)仍超越其他模型;高復雜度場景下
,極大提高了訓練和推理效率