被說消失很久了趕緊浮上來發一個極其無意義的感慨,大家好久不見呀!
其實一直都有悄悄在河道上飄流,只是常常打了一兩個字就忘記要回什麼,或是噗裡太多人了很不好意思回,結果最後腦袋想的都沒打出來就關掉了(ry)
大家以為我沒有出現嗎?
沒有!在我的腦海裡已經回了你們千千萬萬遍! ![](https://emos.plurk.com/66ac400a0dfe9823590ebd1a5f2a0ac9_w39_h18.gif)
(倒是打出來啊!)
可以等清明連假
228已經是過去式了
需要⋯⋯四月⋯⋯連假⋯⋯
un1996: 雲回覆wwwwww 雲回覆好好笑wwwwwww 沒錯就是雲回覆!今天也回了好多人呢真是個滿足的一天(心滿意足地關機)(嗯???)
elisaveta: 就連這個噗都是先在腦袋回了幾天之後才想起來還沒被輸出成文字喔
![](https://emos.plurk.com/66ac400a0dfe9823590ebd1a5f2a0ac9_w39_h18.gif)
(你要不要去檢討一下)
pingumi: 還沒有過連假的感覺連假的靈壓就消失了怎麼可以這樣!是誰!是誰用了鏡花水月!!
想要修改個回應的時候才發現噗幣又沒了,提醒自己明後天再去買一波
說是這麼說,但發噗的機會好少,感覺一個月30天裡有29天噗幣都在放水流……
可以修改錯字就是賺
Aesior: 可是汁汁熊,我一個月裡浮水起來的次數只有5分之30……
![](https://emos.plurk.com/9cc6f7926ef8f25fe5e8d2e392f94640_w45_h45.png)
(所以說檢討啊!)
Aesior: 太有道理了汁汁熊!接下來的問題是我身後的國文老師們看起來很生氣怎麼辦在線求解20點!!!!!
un1996: 考慮到每次大半夜發噗的隔天就會忘記發過什麼東西,感覺起來真的跟夢遊發噗沒什麼兩樣呢!
![](https://emos.plurk.com/299faaf87874aa95241796a33161a702_w48_h48.gif)
(意識不清到直接失憶)
列在管理部,身在財會部,然後做著管理部業務部和財會部的工作,多……采……多……姿……
開宗明義:「我不想做財務的工作。」
一段時間後~
「這是會計的工作喔^^」
「……我知道。」
不……我不要再看到數字了……窩不要再碰到數字了……三年後怎麼又飛回來了這些數字……財務財會使人變得暴躁……(痛哭流涕)
拜此所賜現在每天只要一看到一疊跟錢有關的白紙眼神都會瞬間變得很恐怖,嗚呼哀哉
字打一打就一陣頭暈,是不是真的該休息一下了
![](https://emos.plurk.com/650dd852373326c4daed9e062f16f472_w48_h32.png)
可是好不想睡覺……睡覺就什麼都沒了……啊……
天R久草你快休息,你需要休息,不要勉強自己那樣效率會很低而且又會不舒服(塞入被窩
kulame: 謝謝藏影!那天午休時間趴了十分鐘後好多了,醒來之後不禁覺得人類在某個程度上就跟小強一樣充滿韌性呢(
ai_iro: 謝謝夕映!最近回到家一摸到床就會倒在棉被上當棉被的棉被,這麼睡一下之後就好了不少
然後就會想要熬夜
怎麼可以有蚊子,怎麼可以有蚊子!讓我睡十分鐘也好啊!蚊子!!!(震怒揮舞蚊拍) 完蛋了今天是不是不用睡了,這隻蚊子看起來很大又餓很久,不曉得開電風扇有沒有效
……只好睡前超前布署,讓防蚊液充滿房間……
![](https://emos.plurk.com/9cec71b8ee48ee05498d607cefb8cfe1_w48_h48.gif)
(然後蚊子就跑去找其他家人了)(怎麼有這種人)
pingumi: 好懷念喔蚊帳wwwwwwww 可惜我的床不適合用蚊帳,用下去可能會變成寫做蚊帳唸做捕魚網的蚊子餌食天堂
alllifeisagameofluck: 用過帳篷型和吊掛式的過來人告訴你,各有好有壞
帳篷式的幾乎不會有蚊子跑進去,只是缺點就是不好收
垂掛式的就是常常會有蚊子不知道從哪跑進來,而且常常被棉被吃進去有點煩,優點就是好收納
我自己是用這個
我有裝過門簾的,可能是便宜貨品質太爛,邊緣沒辦法黏緊,還是有蚊子闖進來
pingumi:
Aesior: 謝謝南暄和汁汁熊!這邊的房間因為是和室所以不太適合裝蚊帳,但以後如果(有機會)出去住的話很想裝來試試看
#災情
手機的Line打不開,噗浪也打不開,怪了七點多的時候還好好的,是這邊的手機問題還是Android系統又在耍脾氣了?
去google play 停用 下面的程式
大部分 app 就復活了
再不行就要移除可龍
un1996: 好問題,這邊也有點忘記是什麼時後換的了,應該只有用一年……?一邊這麼想著一邊跑去翻紀錄確認,大概是2019年9月買的,算一算也差不多一年多一點
是說原來一般的頻率是三年就換一次嗎?我的目標是希望和上一支一樣至少撐五年
kenyaya: 謝謝肯亞!雖然今天才回但是你拯救了我昨天的手機!!!(吶喊)
三年大概電池續航力的一個期限,完全不玩手遊的話可能可以撐五年(?
不過也要看你用誰家的手機,安卓機真的就......
un1996: 這邊上隻手機也是換了一次還兩次電池才能活到五年還六年,可以的話這支手機希望也可以靠換電池的方式延命,不然手機好貴喔……
![](https://emos.plurk.com/ffe235081bbe441ba722965840b96c6c_w48_h11.gif)
(捧著薄薄的錢包)
這種天氣實在讓人很……想……睡……臉快要趴到桌上……了……
(眼睛撐開)(閉上)(再撐開)(再閉上)(再撐開)(再閉上)(再ry)
好想睡覺……難道是睡眠不足的反撲終於來了嗎……窩是不會屈服的哼哼哼……(瞇眼)
突然出現了喉嚨癢的咳嗽症狀和頭痛症狀,想不透在幾乎半天都戴口罩+吃飯前一定會洗手或噴酒精的生活裡是怎麼(疑似)染上感冒的,打到這裡驀然想起這陣子回到家一摸到床就會趴在棉被上失去意識
原來是著涼啊!
天氣冷了,大家穿暖之餘也要記得睡覺時要蓋棉被喔
根據WIKI上的記載,2017年時團隊主辦人華侃如第一次公開了「Synthesizer V」的開發進度。既然宣稱是「長達7年的研發成果」,回推一下應該在2010年時就開始研究了(據說是促使他開始研究語音合成的動機的「VOCALOID」,其第一款MIKU的發表是在2007年)。
經歷過2017年的公開,接著是2018年底的正式開放下載。上面看見的「赤羽」則是2019年初由平行四界(北京福托科技有限公司)取得Synth V中國地區代理後推出的第一款軟ㄊ、我是說,虛擬歌手。
Synthesizer V - 萌娘百科 万物皆可萌的百科全书
與其拿「Synthesizer V」和「VOCALOID」比較,不如拿拿「Synthesizer V」和「CeVIO」比較適合。之所以這樣分類,不得不提的就是「VOCALOID」和另外兩種軟體的根本差異,也就是「AI演算法」的導入有無。
歌聲合成有幾個主要的世代,技術上雖然有更細的分界點,但是比較明顯的分界可能在「拼接合成」和「統計合成」,或者說「AI合成」兩塊。
拼接合成是要求本人以某個較為一致的表情,念或者唱一些設計好的片段集合,這些片段的表情被要求一致與平整的理由,是為了讓分析合成引擎可以較為簡易地伸縮與上下調整音高之後,配合需求拼貼上樂譜需要的部分。
拼接合成預期透過精細的輸入音高波動、音量大小、並透過聲碼器(Vocoder)提供的功能,比如如張嘴大小參數、子音發音時機、滑音發生時機、甚至近期的話會有喉部氣流流量模擬,聲帶張力等等,來「做出」需求的聲調。
也就是說拼接合成沒有任何輸入的時候,直接指打歌譜當下,引擎預設值發出的聲音,與本人的音調可說是截然不同的之外,每個使用者能做出的聲調也有很大的差異。
Anyway,「VOCALOID」使用的就是所謂的「拼接合成」,相對的「統計合成」,就是透過AI演算法去學習人的語調、發音速度、高低音,接著讓引擎自動幫忙調節到AI認為的「人聲」。
上面那篇文章有段很有趣的比喻:
一開始VOCALOID的無調,是一個「新的白紙」;
但是AI的無調,是「本人的拷貝」。
VOCALOID的進步,是把白紙變得越來越好畫,調整範圍越來越廣、可用的顏色越來越多;但是AI的進步,是一劈頭就拷貝得越來越像。沒有刻意去調整,其實是不知道它可調範圍多廣的。
BTW,UTAU和VOCALOID一樣,使用的也是拼接合成。
「Synthesizer V」和「CeVIO」兩套軟體的介面與實際功能到底差在哪裡,因為完全沒概念所以不太清楚,不過根據官方資料,「Synthesizer V」採用的合成演算法是「LLSM(底層語音模型)」,「CeVIO」則是「HMM(隱藏式馬可夫模型)」。
不曉得是「LLSM」實在是太冷門了還是新技術,翻了好久還是翻不出什麼資料來,倒是後者的「HMM」資料一大堆。一查之下才知道蘋果的siri,還有Google的voice search都是以HMM作為基礎技術。
感恩讚嘆泛科學特地把語音辨識的部份拉出來講解,於是底下都是轉貼自泛科學。(合掌)
※
我們還可以進一步用「語音辨識」當做例子,來說明 HMM 的用處。
在語言學上,我們可以把人說話發出的聲音分成各種音節(syllable),所以理論上,我們如果有一段錄音,只要能分辨每一個音節發的音是哪些母音與子音,就能夠把這個人講的話辨識成文字。
任何「理論上」可行的事情,必然伴隨著實務上的困難。
這種「音節對應」的工作看似容易,但是實際上會遇到很多「模稜兩可」的情況。以中文為例,兩個三聲的字連著念,前面的會讀成二聲,加上同音字、破聲字,同字的語音與讀音……等等,都增加了這個「分辨」過程的難度。
那麼,HMM 是怎麼跑進來的呢?
試想,「語音」,是一連串的「音節」,而我們想要辨識成的文字,則是一連串的「字」;對語音辨識系統而言,語音這個「音節序列」是看得到的訊號,而系統想要做的是推測出與其相對應的,看不到的「文字序列」,所以正好是 HMM 所模擬的狀況。
隱馬可夫模型在語音辨識的的應用,大抵始於1970年代晚期的 IBM 計畫(Jelinek),時至今日,我們生活中可以看到的各種語音辨識系統,例如 Apple 的 siri,Google 的 voice search,微軟前不久在北京展示的中英同步口譯,背後都是以 HMM 作為基礎技術。
噢,等等等,終於找到「LLSM」的資料了──咦等一下這是創辦人自己研發出來的模型嗎?(震驚)
「LLSM」,全名「Low Level Speech Model」,底下有關於這個模型的各種資料,嗯──完全看不懂呢!
![](https://emos.plurk.com/66ac400a0dfe9823590ebd1a5f2a0ac9_w39_h18.gif)
(大聲)
但是這個檔案是由主開發者華侃如發布的,網路上相關的資料也老是出現他的名字,難不成真的是他自己摸出來的模型嗎?這也太厲害了吧!
Sleepwalking/libllsm2
雖然壓根看不懂原理,但至少看下來總算了解到這兩間公司到底在做什麼,還有到底為什麼可以輕鬆做出比「VOCALOID」更接近「人類」的歌聲。
把「Synthesizer V」歸類在中國方,「CeVIO」歸類在日本方的話,就是中日語音合成引擎的對抗大戰了呢。(恍然)
好了基於好奇心所以花了一點時間翻翻找找,總算從0概念稍微了解這些東西到底是什麼了。貼了一大串不曉得會不會擾民,感覺好不好意思Orz
雖然Synthesizer V底下最近討論度比較高的應該是
小春六花 ,但聽一輪之後覺得Synthesizer V底下最驚人的反而是沒有角色形象的
Saki AI Lite
說是自動調聲其實也不太準確
因為還是得自己加上各種轉音等花式(?)唱法
自動的部分是自動加上像是走音(人類不可能完全唱準音)之類的「缺陷」來模擬人類唱歌
我覺得這樣比較好 一方面調教師不會失業
可以保留傳統調聲的靈活性
另一方面避免了被濫用的可能
科技真進步
跟上次一樣 只有編輯音高曲線 其他參數沒動
這版本的自動調聲可能比較適合像用 VOCALOID 那樣切割音符來轉音
但我不想ㄏㄏ」
#碎碎念
每隔一段時間就會定番思考起噗浪的續存,到底是該鎖河道?還是換帳號?或是把裡噗撿回來用?或者乾脆不用呢?
前年還是大前年才換過一次帳號,再換一次總擔心擾民;鎖河道對追蹤的朋友感覺不太好意思;裡噗則是不確定使用率高低,很可能最後又變成跟半荒廢狀態沒兩樣。輾轉想來想去還是又變成維持現狀。
追根究底,可能是認為有些東西不適合在人多的地方說……嗎?(思) 最後變得想聊些什麼時反而想太多,礙手礙腳起來了。
公開河道就像個公開場所,會看到的人不見得是熟人,說出來的話也不見得會被往友善的方向解釋,看著三不五時出現的炎上噗後深刻感覺到所謂的自己家的河道不是自己家。
鎖河道的好處是發言相對自由,以及隱私有一定程度(但不是完全)的保障,不過到時候會不會記得發噗又是另一回事了(欸)(結果這才是真正的問題點嗎?)
那你想要找人抒發的東西,可以找我啊,不然就鎖噗只有自己能看,寫成樹洞,再說你也可以發偷偷說樹洞啊
每年每個月都在重複相同的迷茫,如果有其他人分享過的心得可以參考的話就好了
想要曝光率的話當然用公開河道最好,想要隱私性可以鎖好友小圈圈,覺得麻煩可以乾脆鎖河道R
有兩個帳號倒是方便很多
un1996: 小滑got it!這邊有一個辦來自己練蕭威順便當紀錄的帳號,辦了之後只要縮在裡面就會很開心
![](https://emos.plurk.com/66ac400a0dfe9823590ebd1a5f2a0ac9_w39_h18.gif)
(多麼閉屬的人)
pingumi: 兩個帳號真的很方便,有帳號之後首先要養成記得發噗的習慣呢!
突然想起來,之所以沒怎麼發噗好像就是因為常常不曉得要發什麼,或是因為內容太廢了想一想就作罷,不然就是腦袋想了,等有時間發噗時又懶了
![](https://emos.plurk.com/f8f9b4b2774be6e64a137a04892fbfcf_w33_h46.jpeg)
(ry)
pingumi: 南暄家的小鳥超可愛!請多多發!河道需要更多毛茸茸!
![](https://emos.plurk.com/085998d3809d91d43af688a182b2014f_w48_h48.jpeg)
(大聲)
結果我需要先解決的問題應該是雲發噗跟雲回覆嗎?網路新世代雲端噗浪使用者???