知識(shí)
不管是網(wǎng)站,軟件還是小程序,都要直接或間接能為您產(chǎn)生價(jià)值,我們?cè)谧非笃湟曈X表現(xiàn)的同時(shí),更側(cè)重于功能的便捷,營(yíng)銷的便利,運(yùn)營(yíng)的高效,讓網(wǎng)站成為營(yíng)銷工具,讓軟件能切實(shí)提升企業(yè)內(nèi)部管理水平和效率。優(yōu)秀的程序?yàn)楹笃谏?jí)提供便捷的支持!
能騙173萬(wàn)的詐騙電話可以做到多逼真?
發(fā)表時(shí)間:2019-9-16
發(fā)布人:葵宇科技
瀏覽次數(shù):48
在開始之前,世超想先給大家聽?zhēng)锥握Z(yǔ)音,然后大家感受一下,覺得哪段最像是真人在說(shuō)話呢?
語(yǔ)音合成引擎效果測(cè)試
世超也在前面的視頻里標(biāo)出來(lái)了,這幾段語(yǔ)音其實(shí)都是用各家研發(fā)的語(yǔ)音轉(zhuǎn)文字引擎生成出來(lái)的。而這項(xiàng)又被稱為語(yǔ)音合成的技術(shù),其實(shí)已經(jīng)發(fā)展了有一些年頭了。
像我們?nèi)粘S玫闹悄苤怼?dǎo)航語(yǔ)音、甚至聽到的一些新聞播報(bào),用到的都是機(jī)器合成的語(yǔ)音。
AI 主播每天自動(dòng)合成語(yǔ)音和視頻生產(chǎn)新聞內(nèi)容
來(lái)源:澎湃新聞 App
如何合成一段語(yǔ)音
語(yǔ)音合成看起來(lái)很復(fù)雜,但其實(shí)合成語(yǔ)音我們自己在家就能做:
比如把「 支付寶到賬 」、「 元 」和「 一二三四五六 」一類的詞都錄好,以特定的拼接組合方式播放出來(lái),你就收獲了中國(guó) 8 億支付寶用戶都聽過(guò)的報(bào)賬聲。
當(dāng)然了你自己錄的聲音既不甜美,也收不到錢
這種通過(guò)「 拼接 」一段段音頻,最終獲得一份語(yǔ)音的方式,就叫做拼接法。
拼接法制作的合成音,在日常生活中其實(shí)最早可以追溯到 你家街邊拐角當(dāng)年放學(xué)以后必去的小賣部里那位收銀阿姨在結(jié)賬時(shí)手里按著的那個(gè) 超大號(hào)計(jì)算器的語(yǔ)音播報(bào)聲。
“ 加一,加一,加二,等于,歸零!”
最原始的拼接法錄制的樣本就是那么幾個(gè)固定短語(yǔ)句子,給導(dǎo)航錄的音就只能用于導(dǎo)航,你要是問(wèn)它今天天氣怎么樣,它哪怕知道答案也沒(méi)法用語(yǔ)音播報(bào)出來(lái)。
后來(lái),有個(gè)聰明人一拍腦袋,想出來(lái)一個(gè)絕招:要是我把每個(gè)中文字都錄一遍,不就什么話都能拼起來(lái)了么。
不過(guò),拼接法合成的語(yǔ)句還有一個(gè)重大缺陷:語(yǔ)氣和停頓。
給支付寶配音的展妍小姐姐就曾自曝,在錄「 四 」的音時(shí)錄了好幾個(gè)發(fā)音,才保證了不同場(chǎng)景下的合成效果。
來(lái)源:小時(shí)視頻24
并且拼接法也不知道該怎么給「 小明找不到 / 爸爸媽媽很著急 」,「 小明找不到爸爸媽媽 / 很著急 」斷句。
拼接法能解決每一個(gè)字怎么念的問(wèn)題,但是讀出來(lái)肯定不像一個(gè)正常人。
所以怎么讓合成語(yǔ)音聽起來(lái)更逼真,成了大家優(yōu)化的重中之重。
如何讓語(yǔ)音更逼真
這個(gè)時(shí)候,除了增加樣本量,我們還必須引入另外一樣關(guān)鍵的技術(shù):算法。
有了算法的合成音就仿佛被注入了靈魂。說(shuō)的直白點(diǎn),就是「 聰明的算法,知道怎么處理一句話的語(yǔ)氣和停頓 」。
而這種使用算法輔助生成合成音的方式,叫做參數(shù)法。
參數(shù)法對(duì)音源的要求自然更高,「 消除靜音片段 」、「 專業(yè)錄音環(huán)境 」這些都是常規(guī)操作,最關(guān)鍵的是,需要錄制的聲音不再是字的發(fā)音了。
小學(xué)語(yǔ)文教會(huì)了我們,每個(gè)字的發(fā)音其實(shí)都可以通過(guò)類似「波( b )破( p )么( m )佛( f )」這類的聲母和韻母的兩兩組合出來(lái)。
因此只要錄下了這些聲母和韻母的發(fā)音,再通過(guò)算法進(jìn)行合成,任何聲音、任何語(yǔ)調(diào)就都能被生成出來(lái)。
連那些只聞其聲不見其形的那些字兒也不在話下。。
你餓了嗎?
不過(guò)合成音每逼真一分,背后需要考慮到的情況都要增加數(shù)倍,很多時(shí)候,簡(jiǎn)易的算法都不能正確計(jì)算出一句話應(yīng)有的語(yǔ)調(diào)、語(yǔ)氣。
而一旦算法變得復(fù)雜了,運(yùn)算量也就增加了,合成音的生成速度也就變慢了。( 電費(fèi)也增加了 )
來(lái)源:DeepMind 博客
以現(xiàn)在這些大企業(yè)的能力來(lái)說(shuō),只要肯燒性能,逼真的合成音大家都能做出來(lái),但要使用什么復(fù)雜程度的算法,就要在 “ 效果 ” 和 “ 效率 ” 之間做權(quán)衡了。
像我們平常在翻譯 App 里聽到的合成音都比較粗糙,畢竟不能賺錢嘛,能聽個(gè)響就得了。
而在能有錢進(jìn)賬的項(xiàng)目上,合成語(yǔ)音卻做得栩栩如生、惟妙惟肖。
譬如不差錢的廣告商們,就很喜歡買這種服務(wù),畢竟只要量上來(lái)了,肯定比雇真人打電話便宜不是。
說(shuō)起來(lái),大家肯定猜不到,走在合成語(yǔ)音技術(shù)應(yīng)用最前沿的場(chǎng)景是什么。。
是詐騙!
為了騙倒更多人,騙子們是真肯下血本兒啊。。。
就算是這樣,我們也不能只盯著語(yǔ)音合成不好的地方。
像語(yǔ)音助理和智能音箱,平時(shí)方便了不少人。
再比如編輯部里經(jīng)常看小說(shuō)的實(shí)習(xí)生告訴世超,現(xiàn)在的合成音越來(lái)越有「 說(shuō)書人 」的味道了,自從開始「 閉眼聽書 」之后,他感覺眼睛都煥發(fā)了新生。
起點(diǎn)閱讀 App 內(nèi)集成的百度合成語(yǔ)音閱讀模塊
說(shuō)不定以后,我們也能把自己年輕時(shí)候的聲音永遠(yuǎn)保存下來(lái),到時(shí)候讓年老的自己和年輕的自己來(lái)一段對(duì)話,想想好像也挺有意思的~
特別鳴謝:感謝出門問(wèn)問(wèn)的技術(shù)人員支持~
參考資料:
黃釗,語(yǔ)音合成 TTS
Aaron Zhuang,端到端語(yǔ)音合成-從入門到放棄
小時(shí)視頻,支付寶聲優(yōu):靠一句話刷屏,來(lái)自臺(tái)灣顏值爆表
S King,A beginners’ Guide to Statistical Parametric Speech Synthesis
Dr. E Chandra,A Akila,An Overview of Speech Recognition and Speech Synthesis Algorithms
“ 如果給你一個(gè)語(yǔ)音合成引擎,你會(huì)讓它說(shuō)些什么呢?”
推薦↓↓↓
長(zhǎng)
按
關(guān)
注
?【16個(gè)技術(shù)公眾號(hào)】都在這里!
涵蓋:程序員大咖、源碼共讀、程序員共讀、數(shù)據(jù)結(jié)構(gòu)與算法、黑客技術(shù)和網(wǎng)絡(luò)安全、大數(shù)據(jù)科技、編程前端、Java、Python、Web編程開發(fā)、Android、iOS開發(fā)、Linux、數(shù)據(jù)庫(kù)研發(fā)、幽默程序員等。
相關(guān)案例查看更多
相關(guān)閱讀
- 百度小程序開發(fā)
- 做小程序被騙
- 云南省城鄉(xiāng)建設(shè)廳網(wǎng)站
- 排名
- 網(wǎng)站小程序
- 網(wǎng)站建設(shè)優(yōu)化
- 河南小程序制作
- 網(wǎng)站建設(shè)靠譜公司
- 小程序模板開發(fā)公司
- 云南網(wǎng)站設(shè)計(jì)
- 網(wǎng)站上首頁(yè)
- 百度推廣
- 云南省建設(shè)廳官方網(wǎng)站
- 小程序
- 小程序開發(fā)聯(lián)系方式
- 云南建設(shè)廳官方網(wǎng)站
- 退款
- 小程序公司
- 小程序定制開發(fā)
- 昆明軟件定制
- 定制小程序開發(fā)
- 日歷組件
- 昆明軟件公司
- 網(wǎng)站建設(shè)選
- 微信小程序
- 報(bào)廢車拆解系統(tǒng)
- 網(wǎng)站優(yōu)化公司
- 云南網(wǎng)站建設(shè)哪家強(qiáng)
- 網(wǎng)站建設(shè)專家
- 微信分銷系統(tǒng)