DoTaMoonNight: 我是相關業者,我破解一下大家對文字生成性AI的迷思,其實那不算是AI。它只是一個巨大的統計資料(所謂的模型),他在做的其實是「文字接龍」,原理類似任何能自動預測下幾個中文字的輸入法,例如輸入「過」,就出現「過來」、「過故人莊」、「過錯」、「過世」。然後LLM的模型裡面,會給每一個接法設不同的機率,運作時根據使用者輸入的文字,連鎖生成機率高的一串字。
那這些機率、字與字連結的可能組合怎麼來的?這就是模型訓練階段時,使用的訓練文本的作用。
例如A社群媒體上的對話都很偏激、偏頗,那訓練出來的模型就會傾向生成有毒的內容,輸入「過」,「過世」的機率會很高。
LLM就是機率統計模型,相當於超厲害的文組高材生,強記了各種對話的應對、公式,知識等等,但是它其實不懂內涵不會判斷、決策。