但是電腦的聲音沒有感情,平淡無起伏,讀起來也斷斷續續的。
和後世的導航聲音原理差不多。
計算機是個很笨的東西,它的強項在於重複運算,而人類能做到的很簡單的事,對於計算機做來說就很困難,需要成千上萬的指令,甚至大部分是不可實現的。
比如感情、判斷,直覺等等。
一個成年人,‘斷句’是非常簡單的事,根本不用過腦子,計算機卻得經過n道運算,無比廢力。
所以也有人說,人類本身,就是上帝創造的一種最神秘也最偉大的‘生物機器’。
“我打斷一下。”趙澤君抬頭看了眼時間,然後說:“據我所知,科大騰飛也在做人工智慧語音這一塊,而且做得比你要好。我聽過,更加流暢,而且已經可以達到用中、英兩種語音。你的產品,優勢在哪裡呢?”
“趙總,這就是我接下來要說的。”李燃嚥了口口水。
“別緊張,時間還很多。”老趙揮手笑笑。
“嗯。”李燃說:“是這樣的,騰飛的識別和朗讀,起步早,投入大,比我的研究要領先。但是在人聲音的模擬上,我可能要超過他們。”
“騰飛也有人聲模擬吧。比如,模仿某個明星的聲音。”趙澤君很清楚的記得後世的導航裡,應用的就是模擬技術,可以選擇郭德綱的聲音,林志林的聲音,聽起來還都挺像那麼回事。
“但是您不覺得,騰飛模擬的聲音,這是形似,而不是神似嘛?”說起專業擅長,李燃好像變了一個人,目光炯炯有神地反問,“是能模擬出明星的聲音,可並沒有神韻,一聽就是機器聲。”
“這倒是。沒有感情起伏和頓挫。”趙澤君點點頭。
“用專業術語說,聲音三個主要特徵,是音調、響度和音色,響度是聲音波形的振動幅度,音調的頻率,也即是經常說的男高音、女中音之類,音色是聲音波的波形,決定了聲音的品質。”
李燃開始侃侃而談:“模擬一個人的聲音,第一步是這三個特徵和本人的特徵極為接近,這一點上,騰飛做得比我要好,但並非不能趕超的。像跑步,他們跑得快些,先跑了半分鐘,我雖然落後,但只要一直跑,也能達到他們的水平……”
老趙點點頭,示意他繼續。
“第一步,三種特徵實現形似,第二步,想要實現神似,就必須捕捉一個人聲音這三者的配合方式,透過計算機表現出來,並且要儲存一個人大量的說話習慣,才能模擬對方真實的說話聲音。”
“你能演示一下嗎?”趙澤君問。
“可以。就用我自己舉例子吧,我在資料庫裡儲存了我個人大概十個小時的講話,講話內容都很隨意,如果不用這個資料庫,電腦模仿我的聲音,大概是這樣的……”
他點開了程式,電腦的讀了一段話,乍一聽和李燃的聲音很接近,但稍稍留心下,就會判斷出這不是李燃。
有形無神,像是李燃很機械的在說話。
“那麼如果用我的聲音資料庫,進行分析後,就是這樣的……”李燃低著頭一邊操作電腦,一邊說。
可說完之後,電腦沒有發出任何聲音。
“怎麼了?”趙澤君一愣,問。
只見李燃抬起頭來,笑呵呵的看著老趙,嘴唇緊閉。
但是他的聲音又一次在房間裡響起:“那麼如果用我的聲音資料庫,進行分析後,就是這樣的……”
“哦!”老趙恍然大悟,剛才李燃低頭時候根本沒說話,他聽到的,只是電腦裡的人工智慧聲音。
“有點意思,你再放一遍,我仔細聽聽。”趙澤君說。
“我放點別的吧,讓它讀一段文章。”李燃這次是自己說的,然後匯入了一段常用的聊天話