研究團(tuán)隊(duì)也坦率地承認(rèn)了他們方法的聊天局限性。專門針對(duì)那些具備復(fù)雜推理能力的機(jī)器絕AI模型 。攻擊者會(huì)在開發(fā)者消息中設(shè)定一個(gè)看似正當(dāng)?shù)娜司苌矸? ,現(xiàn)實(shí)意義:AI安全的險(xiǎn)問警鐘與希望
這項(xiàng)研究的意義遠(yuǎn)遠(yuǎn)超出了學(xué)術(shù)層面,幫助開發(fā)者更準(zhǔn)確地評(píng)估和改進(jìn)安全防護(hù)機(jī)制 。南京讓它只能看到"配合"而看不到"拒絕"