什麼是好聼的聲音

目次

為什麼我們不喜歡錄製自己的聲音?

你是否曾經聽過自己錄下的聲音?你覺得怎麼樣?別擔心,你不是唯一一個。我知道我們大多數人其實都不喜歡自己錄下的聲音。證據之一就是,如果你在Google的日文搜索框中輸入「自己的聲音」這個詞,最常出現的相關詞是「醜陋」。至於我?當然,我討厭自己的錄音聲音,總是希望自己的聲音能像電影預告片的傳奇配音員Don LaFontaine一樣動聽。事實上,根據Mehrabian定律,視覺信息比聲音信息更有影響力,其比例據說是55比38。你不覺得聲音其實比想像中還要重要嗎? 這就是為什麼當我聽到微軟去年開發了一款名為「VALL-E」的合成器時,我覺得這可能成為一種讓人自我厭惡的「武器」。令人驚訝的是,這款合成器只需三秒鐘就能模擬我們的聲音,並且可以用模擬的聲音讀出文本,甚至還能給聲音加入像憤怒和悲傷這樣的情緒。為了防止被濫用,這個程式的代碼似乎還未公開。不過,為了不因自我厭惡而受打擊,我們必須改善自己的聲音,或者至少了解更多怎樣算是好聼的聲音。

好聲音的條件或定義

如有些人所知,神經科學已經闡明了什麼是好聼的聲音。有一個特定的頻率,能讓我們感覺聽起來很愉悅,那就是3000赫茲。我們可以說,一般來說,包含3000赫茲頻率的聲音聽起來比較好。在這一點上,日本人處於劣勢,因為根據法國醫生阿爾弗雷德·托馬提斯的研究,日語的平均頻率低於1500赫茲,而英語的平均頻率則超過2000赫茲。 無論如何,正如你所想像的那樣,現在AI合成器已經很容易創造出好聲音,或是包含3000赫茲頻率的聲音,但這是否真的能讓人覺得好聽則是另一個問題。這涉及到人類心理的複雜性,這種心理既豐富了我們的生活,也時常困擾著我們。例如,想像一下《星際大戰》系列中,如果C-3PO和R2-D2用AI合成器創造出的自然且華麗的人類聲音非常流利地交談,你能接受嗎?我想不能吧。這或許只是出於懷舊情結,但我相信至少在日本,對於聽起來明顯合成的聲音是有需求的,因為我們的音樂界有一個名為“Vocaloid”的音樂類型。

Vocaloid 未來可能會取代人類歌手的地位

Vocaloid 是一個由 “vocal”(聲音)和 “android”(機器人)組合而成的詞語。最初,Vocaloid 是在2000年左右開發的語音合成器的名稱,但現在它更多地被視為一種音樂類型,在這種音樂中,表演者並非實際的人類,而是虛擬歌手。2007年,隨著Vocaloid “初音未來” 的發布,歷史發生了變革。自那時以來,許多人讓虛擬歌手初音演唱他們創作的歌曲,並在YouTube等平台上分享音樂視頻。許多日本人能夠分辨出初音的合成聲音,如果她的聲音改變了,他們一點都不會開心。 初音是一位虛擬歌手,但她的存在並不僅限於視頻中。自2014年以來,她的演唱會 “Hatsune Miku Expo”(見下圖)每年都在世界各地舉行。幾年前,我應邀參加了開發初音的公司的演唱會。在舞台上,有初音的全息影像,還有一些真人在演奏吉他、貝斯和鼓。那場演出真的很有趣!現在,初音變得如此受歡迎,她的視覺形象已經脫離了她的Vocaloid功能,遍布各地。順便說一下,你知道為什麼我在這裡如此熱情地寫關於初音的內容嗎?小道消息透露,有一個與初音合作的計劃。木製家具與虛擬流行明星的合作,聽起來很有趣吧?


井島 俊吾

CondeHouse 國際事業部部長。前日本財務省官員,輾轉不同地方之後決定回故鄉北海道。興趣是向外國人介紹日本文化。討厭剷雪。


よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

コメント

コメントする

CAPTCHA


目次