Facebook
ref Eric Lin

中國的LLM模型分數普遍很高,部分甚至超越GPT4,但研究者指出這些模型通常都是使用三種方法來作弊:

1.利用GPT4提煉出來的答案來進行訓練。
2.上網找考古題然後以之微調模型。
3.專門蒐集一大堆評測題目和答案,直接丟進參數裡面訓練。

這三種訓練方式根本就是華人教育中被視為理所當然的事。

但專家表示:這種模型很會考試,但實際用處不大。

#揠苗助長