精進波羅蜜
4 months ago
是說大家如果還記得,去年年底我就用同一個Llama 2語言模型為基礎,再加上我自己訓練的爌肉飯輔助模型,希望打造一個精通爌肉飯的AI工具,結果問這傢伙,爌肉飯的來源時,他竟然回答爌肉飯的起源是把敵人的肉剁碎醃起來,再配飯吃的美食。那你說,我都訓練了爌肉飯模型,我會沒有訓練軍事相關知識的模型嗎??我的結論是Llama 2這個開源模型還不成熟,在訓練時吃了太多垃圾資料,問題實在太多,你完全無法預測這個模型什麼時候會犯錯。也許未來新的Llama模型會改進,但如果是用Llama 2,那技術程度很低,連我都作得到,而且完全沒有實用性,就是用來騙錢的。(Ps:之前台灣也有類似的騙錢手法,用這東西搞了一個專案,拿了補助款,最後一上線被發現根本是垃圾,馬上就收了。)路透:中國研究員用Meta語言模型開發出軍用AI工具 - Rti央廣
latest #7
精進波羅蜜
4 months ago
不過這東西真的潛力無窮,未來有太多可以作的事,我還搞了一些不足為外人道的東西,玩的很開心。
🐱口滋A打油🐱
4 months ago
【關鍵專訪】理直氣壯講幹話!大型語言模型訓練AI為什麼喜歡「不懂裝懂」亂回答? - TNL The Ne...『大型語言模型在遇到越困難的題目時,它不會告訴你它不知道,它反而傾向於假裝自己是專家而給出一個錯誤答案。』
OmypartyO
4 months ago
你真的不知道爌肉飯/肉燥飯的起源是商代安陽的人骨加工基地裡,奴隸把削下來的碎肉拌在已經乾掉的小米粥上嗎?
立即下載
allen2772
4 months ago
周末愉快
無住生心
4 months ago
(p-goodluck)
Thinker
4 months ago
題外話,請問你用什麼樣的設備進行訓練? 是否有留下相關文章?
精進波羅蜜
4 months ago
Thinker: 因為我是用CCP套件,在個人電腦上跑LLM,所以採用CCP的微調方法,參考的是這篇文章,希望對你有幫助。Finetune LoRA on CPU using llama.cpp
back to top