所有測試數(shù)據(jù)集的南京"拒絕率"都大幅下降,即使是航空航天何讓相對(duì)較新的GPT-4.1