[AI探討] https://images.plurk.com/7mbBwpc0FbSqiCN9yrL2cu.jpg 來源K島避難所的某串回應
個人想法:衝擊多少會有,老實說進步真的挺快的,原動力就是發現這種做法人人都能產圖,這種行業外的參與成為世界級的運動,看看C網上的速度,只要能拿到別人圖且有顯卡就能做LORA
以後就是等別人發布圖拿來跑AI了,幹嘛還要自己畫,這樣的心態在未來會越來越多,包括繪師
latest #15
我不清楚目前P站上面對於AI產圖的觀感是如何,目前是關注一下瀏覽量的話,大多數人還是避免看到AI作品的,這關係到很多層面,可能是粉絲對於繪師的保護心態等等的
但是以現實面來說,只要繪師發布二創的話,就能夠被AI使用者拿來利用,且沒什麼門檻,在短短幾天內就可以追上繪師作品的精緻度
也就是說目前AI尤其是LORA的技術來看,對繪師來說確實是不利的,目前能夠接案也是基於AI創作者會發生版權糾紛,而委託繪師比較沒爭議,但這也只是人自己的一廂情願吧
看目前做的不錯的AI生圖,特定角色的細節是做到幾乎90%了,對於一般觀看者來說,那10%的差異可能沒有差別
我認為AI之亂的關鍵不是它本身可以做到什麼,而是在目前的商業環境當中,這技術攪爛了既有的框架,且是給予人人有槍的方向
意思是說,在傳統上版權保護創作的框架已經不再適用
假如我拿別人生成的AI圖(非關鍵詞)直接盜圖後聲稱自己的創作,並且堅持AI圖"沒有版權歸屬",那麼以AI為中心發展的商業也將變得一團亂
更像是在AI圈的所有人都在生產共有財的概念,而在該市場當中只有傻子會被騙錢,久了之後就是你有我也有,大家除了花錢買顯卡跟付電費之外,額外的附加價值會逐漸消失
立即下載
然後傳統上的繪師會面臨兩邊困境,第一是自己畫圖秒秒鐘就會被拿去算圖給AI遞刀子,產生了創作倦怠
另一個困境是需求方即業主有AI產業的選擇,當然對業主來說他面對的是版權歸屬,畢竟AI這東西就跟社會主義一樣,你的可以是我的,只要日本基於二創的版權法持續這樣的環境,AI就能先占領市場,最後演變成只有顯卡商在賺錢
那我假設以案主不在乎商業利益(我覺得是不可能),然後找AI後進入了AI的版權混戰,或許也找到了新的營利模式,成功靠AI來轉型,那麼變相的整個創作市場需求倒向AI,未來的繪師就再也不用學習傳統美術(素描),而是使用AI工具了,這樣的未來給人的感覺就是所有創作的理念都是由演算法來決定,而會更像是價值觀趨同(AI就是找大家共同美感),然後多數新進繪師也無法在AI工具的框架下重新尋找風格,進入死胡同
不過有道這一步,傳統創作者又會被重視,就如歷史上的後現代主義、嬉皮這樣反抗當代社會氛圍以及強勢文化的反抗,當天平往AI那邊倒過去後又會再次審視過創作的意義,但是那個時間有多遠,沒人知道。
只不過不管任何創作者都面臨的一件事情就是不管你做了什麼屬於你的創作,在AI的工具下都會被模仿,即使還無法學到跟你本人一樣,但是在網路上就已經足夠欺騙人了
所有的AI使用者都在等待走在前面的肥羊
另外一個話題,我自己有用一下AI,還在學習AI到底能夠給予繪師什麼,目前的觀察是,其實有限,真的很有限
最主要原因在於現在這個AI就是拿大數據融合內容出來而已,它給繪師的答案,對多就只有"大家都這麼做,你也應該照這樣去做"
舉例,我透過關鍵字找服裝,撇開img2img(這誤差會更大),模型內的資料大多會把該服裝的最基本型給算出來,而這個基本型"我去Google都能翻到"
那我為何不去找照片圖片呢?用AI幫我穿在人物身上到底跟我翻找參考後自己畫過一遍,這兩者到底有何差異呢?
我認為是對世界的理解,AI在基本型的服裝當中非常精準,因為素材真的夠多,多到大概每一個角度都有了吧,只要把某圖的這一面跟另一張圖的素體角度剛好一致,就能二合一了,中間加一些液化
所以目前就我使用上得到的心得是,模型自己有幾套它非常擅長的服裝,只要你是用TEXT2IMG,你不能要求AI設計一套新的服裝,但至少讓它來畫,八九不離十,這是我用TEXT2IMG出來的服裝 https://images.plurk.com/6e1eirh9yWLHGtcfMLpC9X.jpg 結構都是正確的,可能頂多公主袖有點怪,但是在模型各種融合上,某個關鍵字的呈現都會有它最擅長的一種表現方式,而它的運作邏輯就只會針對那一部分(最安全)的進行不斷產圖
所以目前上IMG2IMG的問題比TEXT2IMG大非常多,但這剛好是繪師最需要的部分
就連近期討論熱烈的ControlNet讓img2img也變得可控
但問題核心是,"當你給予更多前提的時候AI也就越來越難以理解你的需求",這個事實是不變的
LORA的出現是一個偷吃步,只要把這東西當作是模型的DLC看待就可以了,模型本身是一個遊戲框架,在這基礎之上添加各種不同需求的DLC或是MOD就能改變主題的方向,進而達到更具有突破模型本身通用的侷限性
但是伴隨的問題也很明顯,"不存在宇宙所有事物都能有人幫忙做LORA",因此創作者要馬自己做成LORA不然就是等,這種必須仰賴於既有創作物的特徵性才能計算出來的DLC,無法在AI體系當中完成。
原因很明顯,那就是AI本身具有非常明顯的隨機性,而LORA必須拿到"足夠精確的參照物",這點上唯有人類可以辦到,未來沒有人類的創作,LORA就會進入放大誤差的發散,有點類似勞侖次吸引子的概念,當參數大於收斂時,內容物將會進入渾沌狀態
簡單說,LORA一旦使用的是AI自行生成體系的封閉運作,LORA就會抓不到特徵
後面這段也是呼應目前的AI跟人類到底有什麼根本上的差距,就是對世界框架的認知程度,我在玩ChatGPT的時候也同樣發現這點,畢竟不管SD還是ChatGPT都是OpenAI下的產物,這些仰賴大數據的運作模型,時常面臨因果關係的矛盾,因為他們幾乎無法找到一個前因後果是完全建立在問題上的範本,因此只要問題越具有獨特性,誤差就越大,跟繪畫AI是一樣的道理
不過AI還有一個最讓人類陷入困境的是"它們會掰",或是說想辦法將矛盾點給融合在一起的部分,譬如服裝的內襯過了一個腰帶後直接變色,乍看之下好像是不同一件,但仔細看會發現服裝的堆疊設計以及車縫線確實是同一件,但顏色確實變了,那就是上半身的服裝跟下半身的服裝,兩個來自的內容物不同,藉由腰帶的區分,讓人以為是兩個不同東西,這是一種合理化行為
ChatGPT詢問印刷廠的時候我也得到一樣的狀況,有該廠商的名稱,但是並不是做印刷業務,然而地址跟電話對不起來,這就是很明顯的例子
最麻煩的地方在於,你乍看之下好像給你了一個"肯定的回答",事實上是全部錯誤的,這比AI回答你他不知道還要嚴重
人類在工具的發明當中一直是基於"精確"為目標不斷研發,AI理當也應該是在這樣的目標下誕生,最大差別在於工具根據需求不同你得學習它操作的格式以及順序,不然該工具就會失去原本設計的用意
AI是在一定程度上讓操作簡化,更像是填補了人類操作機器的這個動作,就已AI繪圖來說好了,以往的畫圖使用的筆是客觀的,它會在你的手部肌肉驅使下往任何一個你引導的方向去,因此精度取決於使用的人如何理解工具的操作
AI則是降低工具的使用門檻,並且利用演算法來理解你的想法,代替你使用工具來操作,假如每個人在面對A問題的時候都會給出一樣的答案,這部分就會被AI給認知到(大數據),當你操作的時候AI就會拿別人的情況套用在你身上,並且替代你操作,換言之當你有其他的需求時候,給予AI前提,進而改變參考數據庫的內容,達到更客製化的替代性
整理上面的論點,AI的用途就是幫你做出原本應該更具有專業技術的銜接,只是它是拿別人都認為的來"推敲"你的意思,這在很多領域當中是行得通的,且運作得非常好,但是到了創作這方面就會出現一堆問題,只要越是抽象概念的事物,本該"通靈"就越不可能辦到,我認為AI跟車子的發明意義不同,車子是在人類生物結構的再進化,但是你的腦依然可以決定你要去哪裡,AI是你不能跟它說清楚你要去哪(或是你不知道),由它告訴你大多數人的答案,有的正確有的當然會錯誤,至今為止人類的思想永遠都是科技發明工具無法替代的一部分。
AI大智慧 以後只需溝通師了
back to top