專屬客服號
微信訂閱號
全面提升數(shù)據(jù)價值
賦能業(yè)務(wù)提質(zhì)增效
在八十年代初,人工智能的先驅(qū)馬爾文斯基曾經(jīng)談?wù)撨^人工智能的前景。馬爾文斯基預(yù)測,在以后的世界里,機(jī)器會具有和人腦相同的思考能力,他們可以獨(dú)自進(jìn)行和人類的行為相同的活動,比如閱讀,比如汽車駕駛,或者聊天。
如果在當(dāng)年看來,這些構(gòu)想真的很遙遠(yuǎn)。而在今天,這些遙不可及的設(shè)想也在逐漸實(shí)現(xiàn)了,現(xiàn)在的智能產(chǎn)品能夠聽懂我們的指令并做出相應(yīng)的行動,除了能分辨我們的聲音,機(jī)器人還能夠通過人臉識別幫助我們尋找目標(biāo)人物。人工智能的技術(shù)讓機(jī)器人行業(yè)掀起了新一輪變革。
智能產(chǎn)品不斷涌入大家的視野,智能機(jī)器人開始在工業(yè)等眾多行業(yè)投入使用,人工智能的發(fā)展直接影響了眾多行業(yè),就在11月7日上的世界互聯(lián)網(wǎng)大會,搜狗推出了AI合成主播產(chǎn)品,至此,人工智能的影響行業(yè)又再增添一項。
“AI合成主播”是什么
所謂“AI合成主播”,顧名思義,是用人工智能技術(shù)合成的新聞主播。“他”不僅能用和真人一樣的聲音進(jìn)行播報,甚至,連唇形、面部表情、肢體語言也能夠與真人主播吻合,達(dá)到真假難辨的效果。“AI合成主播”的價值在于,可以大幅壓縮新聞播報視頻的后期制作成本,新華社副社長劉思揚(yáng)表示:“從今天開始,新華社AI虛擬主播就將正式上崗,成為新華社報道隊伍中新的一員。”
“AI合成主播”的技術(shù)原理
搜狗語音交互技術(shù)中心總經(jīng)理王硯峰透露,只需要由真人主播面對鏡頭錄制一段播報新聞視頻,“搜狗分身”技術(shù)憑借這段視頻,就能將真人主播的聲音、唇形、表情動作等特征進(jìn)行提取,然后再通過語音合成、唇形合成、表情合成以及深度學(xué)習(xí)等技術(shù),克隆出具備和真人主播一樣播報能力的“AI合成主播”。
王硯峰提到的“搜狗分身”技術(shù),是搜狗公司的前沿技術(shù)之一,它包含語音合成和圖像生成兩大引擎。
(1)語音合成技術(shù):
AI主播首先要實(shí)現(xiàn)的功能是在計算機(jī)有文本輸入時,能夠以主播的音質(zhì)發(fā)出聲音。這項技術(shù)其實(shí)也是語音識別的過程,分為以下步驟:
語音合成技術(shù)首先對主播的聲音進(jìn)行提取,再通過不斷的訓(xùn)練學(xué)習(xí),提取該主播聲音中的特征信息,進(jìn)而建立和主播語音相同的多維度語言語音模型,最終實(shí)現(xiàn)在輸入文本時,能夠輸出該主播語音的功能。
(2)圖像生成技術(shù):
除了語音的學(xué)習(xí)訓(xùn)練,AI合成主播還需要學(xué)習(xí)主播的表情。和語言識別的性質(zhì)相同,圖像生成也要通過不斷的訓(xùn)練學(xué)習(xí)構(gòu)建模型來獲得。現(xiàn)階段可以采用人臉識別、三維人臉重建、表情建模技術(shù)對人臉進(jìn)行分析,建立人臉的多維度數(shù)據(jù)模型。最終在輸入文本,視覺信息和音頻之間構(gòu)建聯(lián)系。
基于這兩種技術(shù),搜狗的AI分身能夠?qū)崿F(xiàn)和人類主播一樣,為輸出的文本中添加相應(yīng)的音色和語調(diào),豐富AI合成主播的形象,提高觀眾對AI合成主播的接受度,同時,AI合成主播能夠識別中英文兩種語言,擴(kuò)大了AI合成主播的使用場景。
人工智能發(fā)展還在繼續(xù)
目前,機(jī)器人已經(jīng)開始在工業(yè)領(lǐng)域大批量使用,并能夠完成人做不了的事情,不過機(jī)器人超越人類只是表現(xiàn)在較少的領(lǐng)域,例如制造業(yè)、服務(wù)業(yè)等,如果通用型機(jī)器人能夠全面超越人類,那么將是一個很大的震驚。
人工智能從多個方面賦予機(jī)器人全新的能力,在感知檢測方面,通過視覺、力覺、聽覺等多種傳感器,使機(jī)器人獲得了像人類眼耳鼻舌,以及聲音在內(nèi)等的感知系統(tǒng),機(jī)器人可以聽懂人類的語言,可以識別人臉,這些功能的開發(fā)進(jìn)一步擴(kuò)展了機(jī)器人的應(yīng)用場景。
現(xiàn)在智能機(jī)器人已經(jīng)被開發(fā)出很多新的功能,例如陪伴老人、下棋、教育小孩子、清掃地面、安防監(jiān)控等等,機(jī)器視覺、語音識別以及更多的感知功能的運(yùn)用,讓機(jī)器人和人的交互增加,提升了用戶使用智能產(chǎn)品的用戶體驗。
“AI合成主播”的應(yīng)用是“搜狗分身”的先創(chuàng)案例,它的技術(shù)使用不止于此。在之后,搜狗可以依靠這項技術(shù)復(fù)制各種用戶需要的人類形象,例如合成教師、合成客服等,而這些產(chǎn)品的出現(xiàn),意味著人工智能產(chǎn)品影響的行業(yè)范圍也會增加。
AI機(jī)器人蘊(yùn)含著巨大的潛力,現(xiàn)階段人們已經(jīng)推出了各種專業(yè)領(lǐng)域的機(jī)器人,從工業(yè)機(jī)器人到教育機(jī)器人、養(yǎng)老機(jī)器人、搶險機(jī)器人、醫(yī)療機(jī)器人等等,這些細(xì)分領(lǐng)域市場雖然遠(yuǎn)未有爆發(fā),但未來的前景是不可估量的。
本文由五度數(shù)科整理,轉(zhuǎn)載請標(biāo)明出處,違者必究!
請完善以下信息,我們的顧問會在1個工作日內(nèi)與您聯(lián)系,為您安排產(chǎn)品定制服務(wù)
評論