「GPT-4 變笨」不只 OpenAI 苦惱,所有大模型與人類相處越久就越蠢
> 「我們發現LLM訓練數據創建日期前公開的資料庫,LLM表現出奇地好於之後資料庫。」
> 也就是說,大模型在之前「見過」的任務表現優秀,新任務相對不佳,這更像檢索模擬智慧法,回答問題全靠硬記,而非純基於學習理解能力。
> 「我們發現LLM訓練數據創建日期前公開的資料庫,LLM表現出奇地好於之後資料庫。」
> 也就是說,大模型在之前「見過」的任務表現優秀,新任務相對不佳,這更像檢索模擬智慧法,回答問題全靠硬記,而非純基於學習理解能力。