為什麼王司徒口中一口老痰吐不掉?文·氓2016-11-25 21:49:37

瀉藥

竊以為是調音過程的必然結果,不信可以聽聽其他系列

為什麼王司徒口中一口老痰吐不掉?霜舞秋傷2016-11-25 22:39:32

你說我一個小小的知乎吃瓜群眾,怎麼就受邀了呢?

就算是邀請回答,也要按照基本法吧?(真心不明所以黑人問號臉)

為什麼王司徒口中一口老痰吐不掉?Z傑洛X2017-02-12 09:21:26

瀉藥。

以UTAU為例(其他的我也不會 0 -||||)。

鬼畜區公認的幾個千年老痰中司徒和金坷垃各佔一半。

原因就是素材的問題。

橫向做一下對比:新葛平音源的聲音是葛平老師自己錄的,而金坷垃和司徒都是擷取影視作品中的,素質本身就不同。

如果你單獨聽音源的wav,你就能明顯感受到差距了。

外加UTAU的一個缺點就是生成出的聲音質量也不太高,需要拖進AU裡面處理一下,比如動個EQ什麼的。

這一點就連新葛平音源有的時候也沒法避免。

單從聲音的角度來看,痰聽覺上就是一種“堵在嗓子眼的,導致人聲嚴重受到干擾的”聲音,而這是音源素材和程式生成兩方面導致的,但是透過對聲音的處理其實可以過濾甚至讓人耳分辨不出來的過濾掉這種痰。

為什麼王司徒口中一口老痰吐不掉?夜遊之夜魔2017-02-13 01:54:15

所謂“痰”的問題真是經久不衰呀,要知道一個音為什麼有痰,我們先要知道另一個好的音為什麼沒痰。瞭解了這點,與痰音一對比,原因其實是一目瞭然的。

大半夜的就配不了圖了,有閒情的可以自己開Au看。

以新葛平音源為例,用Au任意開啟其中一個wav,觀察它的頻譜,適當調節解析度以後,就可以看到一條條明亮的曲線,由低到高地平行排列。這就是母音和部分子音所特有的“共振峰”。

最低一級共振峰就是基音,其高度決定音高;而其他級則為泛音,泛音的高度是遵循規律的,而各個共振峰間的強度比例則決定這個音的音色。

utau的工作,就是檢測出素材音原有的音高曲線,再將它變成我們指定的音高曲線。檢測素材音高線的過程就是frq設定。

原理看起來很清晰,但實際應用時候,我們就會發現並不是所以母音都按套路出牌。新葛平音源按了這個套路,因為它並不是一個人力音源,它是專門錄製的,共振峰清晰,音高線平直。新葛平如今之所以處在人力,僅僅因為它是人力音源“舊葛平”的“新版”。

而反觀人力音源的素材來源,那就千奇百怪,按劇情需要,有咆哮的,有帶BGM的,這些其他的噪音混入了乾淨的母音中,原本在頻譜的一片黑暗中無比清晰的一級級共振峰,在這些噪音的襯托下已經不易識別(譬如獅駝嶺的某位痰王,已經達到了肉眼都無法分辨出共振峰的程度)。那麼,frq檢測這一步就相當困難,結果utau錯把底噪當作共振峰來進行了處理,自然就聽不到正常的人聲。

退一步說,假設底噪沒有達到掩蓋共振峰的強度,你成功地測出了正確的frq曲線,那麼儘管如此,輸出的音符中也依然保留了素材裡的這些混亂,和前後清晰的音符一相比,也會感到較大的違和。

又比如說,一個人發了很低的聲音,聲帶艱難地顫動著,這個音的包絡線是不穩的,不穩的包絡線本身也是痰的另一種常見成因。一般是低音常見現象。

又或者,這個人用氣息說話,聲帶沒有振動或振動很弱。話可以這麼說,但是歌卻沒法這麼唱,對話中發輕聲的字往往屬於這類,一般不適合用作音源。

上策:拼字啊,中文母音就那幾個,全劇又不會只說這一次,放棄模糊的字,用其它清晰的字來拼成它。

中策一:我們可以在頻譜上手動抹去共振峰間的訊號,讓它重新變得清晰。

中策二:傳聞的“拉長消痰法”,拉長一個痰音,讓那些扭曲混亂的雜音在大的拉伸之下變得有序,再把這個長音攔腰砍斷,捨去多餘的長度。

下策:一糊到底,套用H這類低通濾波flag,消去決定音色的那些共振峰,減少痰的辨識度,同時也減少了本音的辨識度,只求音高準確。

為什麼王司徒口中一口老痰吐不掉?李戌元2017-04-24 23:46:40

可能和我一樣有咽喉炎吧- -