欧美三级国产三级日韩三级_亚洲熟妇丰满大屁股熟妇_欧美亚洲成人一区二区三区_国产精品久久久久久模特

能騙173萬(wàn)的詐騙電話(huà)可以做到多逼真? - 新聞資訊 - 云南小程序開(kāi)發(fā)|云南軟件開(kāi)發(fā)|云南網(wǎng)站建設(shè)-昆明葵宇信息科技有限公司

159-8711-8523

云南網(wǎng)建設(shè)/小程序開(kāi)發(fā)/軟件開(kāi)發(fā)

知識(shí)

不管是網(wǎng)站,軟件還是小程序,都要直接或間接能為您產(chǎn)生價(jià)值,我們?cè)谧非笃湟曈X(jué)表現(xiàn)的同時(shí),更側(cè)重于功能的便捷,營(yíng)銷(xiāo)的便利,運(yùn)營(yíng)的高效,讓網(wǎng)站成為營(yíng)銷(xiāo)工具,讓軟件能切實(shí)提升企業(yè)內(nèi)部管理水平和效率。優(yōu)秀的程序?yàn)楹笃谏?jí)提供便捷的支持!

您當(dāng)前位置>首頁(yè) » 新聞資訊 » 技術(shù)分享 >

能騙173萬(wàn)的詐騙電話(huà)可以做到多逼真?

發(fā)表時(shí)間:2019-9-16

發(fā)布人:葵宇科技

瀏覽次數(shù):48

640?wx_fmt=jpeg

黑客技術(shù) 點(diǎn)擊右側(cè)關(guān)注,了解黑客的世界!

640?wx_fmt=jpeg

Java開(kāi)發(fā)進(jìn)階 點(diǎn)擊右側(cè)關(guān)注,掌握進(jìn)階之路!

640?wx_fmt=jpeg

Python開(kāi)發(fā) 點(diǎn)擊右側(cè)關(guān)注,探討技術(shù)話(huà)題!

作者丨世超 來(lái)源丨差評(píng)(chaping321) https://mp.weixin.qq.com/s/Tafx0f4BZutFMl9o3GYK_Q

在開(kāi)始之前,世超想先給大家聽(tīng)?zhēng)锥握Z(yǔ)音,然后大家感受一下,覺(jué)得哪段最像是真人在說(shuō)話(huà)呢?

語(yǔ)音合成引擎效果測(cè)試

世超也在前面的視頻里標(biāo)出來(lái)了,這幾段語(yǔ)音其實(shí)都是用各家研發(fā)的語(yǔ)音轉(zhuǎn)文字引擎生成出來(lái)的。而這項(xiàng)又被稱(chēng)為語(yǔ)音合成的技術(shù),其實(shí)已經(jīng)發(fā)展了有一些年頭了。

像我們?nèi)粘S玫闹悄苤怼?dǎo)航語(yǔ)音、甚至聽(tīng)到的一些新聞播報(bào),用到的都是機(jī)器合成的語(yǔ)音。

AI 主播每天自動(dòng)合成語(yǔ)音和視頻生產(chǎn)新聞內(nèi)容

640?wx_fmt=png

來(lái)源:澎湃新聞 App

如何合成一段語(yǔ)音

語(yǔ)音合成看起來(lái)很復(fù)雜,但其實(shí)合成語(yǔ)音我們自己在家就能做

比如把「 支付寶到賬 」、「 元 」和「 一二三四五六 」一類(lèi)的詞都錄好,以特定的拼接組合方式播放出來(lái),你就收獲了中國(guó) 8 億支付寶用戶(hù)都聽(tīng)過(guò)的報(bào)賬聲。

當(dāng)然了你自己錄的聲音既不甜美,也收不到錢(qián)

640?wx_fmt=png

這種通過(guò)「 拼接 」一段段音頻,最終獲得一份語(yǔ)音的方式,就叫做拼接法。

拼接法制作的合成音,在日常生活中其實(shí)最早可以追溯到 你家街邊拐角當(dāng)年放學(xué)以后必去的小賣(mài)部里那位收銀阿姨在結(jié)賬時(shí)手里按著的那個(gè) 超大號(hào)計(jì)算器的語(yǔ)音播報(bào)聲。

“ 加一,加一,加二,等于,歸零!”

640?wx_fmt=png

最原始的拼接法錄制的樣本就是那么幾個(gè)固定短語(yǔ)句子,給導(dǎo)航錄的音就只能用于導(dǎo)航,你要是問(wèn)它今天天氣怎么樣,它哪怕知道答案也沒(méi)法用語(yǔ)音播報(bào)出來(lái)。

后來(lái),有個(gè)聰明人一拍腦袋,想出來(lái)一個(gè)絕招:要是我把每個(gè)中文字都錄一遍,不就什么話(huà)都能拼起來(lái)了么。

不過(guò),拼接法合成的語(yǔ)句還有一個(gè)重大缺陷:語(yǔ)氣和停頓。

給支付寶配音的展妍小姐姐就曾自曝,在錄「 四 」的音時(shí)錄了好幾個(gè)發(fā)音,才保證了不同場(chǎng)景下的合成效果。

640?wx_fmt=png

來(lái)源:小時(shí)視頻24

并且拼接法也不知道該怎么給「 小明找不到 / 爸爸媽媽很著急 」,「 小明找不到爸爸媽媽 / 很著急 」斷句。

640?wx_fmt=png

拼接法能解決每一個(gè)字怎么念的問(wèn)題,但是讀出來(lái)肯定不像一個(gè)正常人。

所以怎么讓合成語(yǔ)音聽(tīng)起來(lái)更逼真,成了大家優(yōu)化的重中之重。

如何讓語(yǔ)音更逼真

這個(gè)時(shí)候,除了增加樣本量,我們還必須引入另外一樣關(guān)鍵的技術(shù):算法。

有了算法的合成音就仿佛被注入了靈魂。說(shuō)的直白點(diǎn),就是「 聰明的算法,知道怎么處理一句話(huà)的語(yǔ)氣和停頓 」。

而這種使用算法輔助生成合成音的方式,叫做參數(shù)法。

640?wx_fmt=png

參數(shù)法對(duì)音源的要求自然更高,「 消除靜音片段 」、「 專(zhuān)業(yè)錄音環(huán)境 」這些都是常規(guī)操作,最關(guān)鍵的是,需要錄制的聲音不再是字的發(fā)音了。

小學(xué)語(yǔ)文教會(huì)了我們,每個(gè)字的發(fā)音其實(shí)都可以通過(guò)類(lèi)似「波( b )破( p )么( m )佛( f )」這類(lèi)的聲母和韻母的兩兩組合出來(lái)。

640?wx_fmt=png

因此只要錄下了這些聲母和韻母的發(fā)音,再通過(guò)算法進(jìn)行合成,任何聲音、任何語(yǔ)調(diào)就都能被生成出來(lái)。

連那些只聞其聲不見(jiàn)其形的那些字兒也不在話(huà)下。。

你餓了嗎?

640?wx_fmt=png

不過(guò)合成音每逼真一分,背后需要考慮到的情況都要增加數(shù)倍,很多時(shí)候,簡(jiǎn)易的算法都不能正確計(jì)算出一句話(huà)應(yīng)有的語(yǔ)調(diào)、語(yǔ)氣。

而一旦算法變得復(fù)雜了,運(yùn)算量也就增加了,合成音的生成速度也就變慢了。( 電費(fèi)也增加了 )

640?wx_fmt=gif

來(lái)源:DeepMind 博客

以現(xiàn)在這些大企業(yè)的能力來(lái)說(shuō),只要肯燒性能,逼真的合成音大家都能做出來(lái),但要使用什么復(fù)雜程度的算法,就要在 “ 效果 ” 和 “ 效率 ” 之間做權(quán)衡了。

像我們平常在翻譯 App 里聽(tīng)到的合成音都比較粗糙,畢竟不能賺錢(qián)嘛,能聽(tīng)個(gè)響就得了。

而在能有錢(qián)進(jìn)賬的項(xiàng)目上,合成語(yǔ)音卻做得栩栩如生、惟妙惟肖。

譬如不差錢(qián)的廣告商們,就很喜歡買(mǎi)這種服務(wù),畢竟只要量上來(lái)了,肯定比雇真人打電話(huà)便宜不是。

640?wx_fmt=png

說(shuō)起來(lái),大家肯定猜不到,走在合成語(yǔ)音技術(shù)應(yīng)用最前沿的場(chǎng)景是什么。。

是詐騙!

640?wx_fmt=png

為了騙倒更多人,騙子們是真肯下血本兒啊。。。

就算是這樣,我們也不能只盯著語(yǔ)音合成不好的地方。

像語(yǔ)音助理和智能音箱,平時(shí)方便了不少人。

再比如編輯部里經(jīng)??葱≌f(shuō)的實(shí)習(xí)生告訴世超,現(xiàn)在的合成音越來(lái)越有「 說(shuō)書(shū)人 」的味道了,自從開(kāi)始「 閉眼聽(tīng)書(shū) 」之后,他感覺(jué)眼睛都煥發(fā)了新生。

起點(diǎn)閱讀 App 內(nèi)集成的百度合成語(yǔ)音閱讀模塊

640?wx_fmt=jpeg

640?wx_fmt=png

說(shuō)不定以后,我們也能把自己年輕時(shí)候的聲音永遠(yuǎn)保存下來(lái),到時(shí)候讓年老的自己和年輕的自己來(lái)一段對(duì)話(huà),想想好像也挺有意思的~

特別鳴謝:感謝出門(mén)問(wèn)問(wèn)的技術(shù)人員支持~

參考資料:

黃釗,語(yǔ)音合成 TTS

Aaron Zhuang,端到端語(yǔ)音合成-從入門(mén)到放棄

小時(shí)視頻,支付寶聲優(yōu):靠一句話(huà)刷屏,來(lái)自臺(tái)灣顏值爆表

S King,A beginners’ Guide to Statistical Parametric Speech Synthesis

Dr. E Chandra,A Akila,An Overview of Speech Recognition and Speech Synthesis Algorithms

如果給你一個(gè)語(yǔ)音合成引擎,你會(huì)讓它說(shuō)些什么呢?

推薦↓↓↓

長(zhǎng)

關(guān)

?16個(gè)技術(shù)公眾號(hào)】都在這里!

涵蓋:程序員大咖、源碼共讀、程序員共讀、數(shù)據(jù)結(jié)構(gòu)與算法、黑客技術(shù)和網(wǎng)絡(luò)安全、大數(shù)據(jù)科技、編程前端、Java、Python、Web編程開(kāi)發(fā)、Android、iOS開(kāi)發(fā)、Linux、數(shù)據(jù)庫(kù)研發(fā)、幽默程序員等。

640?wx_fmt=png 萬(wàn)水千山總是情,點(diǎn)個(gè) “ 在看” 行不行

相關(guān)案例查看更多