黄色一级大片视频-黄色一级毛片看一级毛片-黄色一级毛片网站-黄色一级毛片在线观看-免费国产h视频在线观看-免费黄色大片视频

電話咨詢 在線咨詢 產(chǎn)品定制
電話咨詢 在線咨詢 產(chǎn)品定制
010-68321050

AI合成主播問(wèn)世,AI應(yīng)用行業(yè)再加一項(xiàng)

五度易鏈 2018-11-08 2176 208

專屬客服號(hào)

微信訂閱號(hào)

大數(shù)據(jù)治理

全面提升數(shù)據(jù)價(jià)值

賦能業(yè)務(wù)提質(zhì)增效

 所謂“AI合成主播”,顧名思義,是用人工智能技術(shù)合成的新聞主播。“他”不僅能用和真人一樣的聲音進(jìn)行播報(bào),甚至,連唇形、面部表情、肢體語(yǔ)言也能夠與真人主播吻合,達(dá)到真假難辨的效果。“AI合成主播”的價(jià)值在于,可以大幅壓縮新聞播報(bào)視頻的后期制作成本,新華社副社長(zhǎng)劉思揚(yáng)表示:“從今天開(kāi)始,新華社AI虛擬主播就將正式上崗,成為新華社報(bào)道隊(duì)伍中新的一員。”


  在八十年代初,人工智能的先驅(qū)馬爾文斯基曾經(jīng)談?wù)撨^(guò)人工智能的前景。馬爾文斯基預(yù)測(cè),在以后的世界里,機(jī)器會(huì)具有和人腦相同的思考能力,他們可以獨(dú)自進(jìn)行和人類的行為相同的活動(dòng),比如閱讀,比如汽車駕駛,或者聊天。

  如果在當(dāng)年看來(lái),這些構(gòu)想真的很遙遠(yuǎn)。而在今天,這些遙不可及的設(shè)想也在逐漸實(shí)現(xiàn)了,現(xiàn)在的智能產(chǎn)品能夠聽(tīng)懂我們的指令并做出相應(yīng)的行動(dòng),除了能分辨我們的聲音,機(jī)器人還能夠通過(guò)人臉識(shí)別幫助我們尋找目標(biāo)人物。人工智能的技術(shù)讓機(jī)器人行業(yè)掀起了新一輪變革。

  智能產(chǎn)品不斷涌入大家的視野,智能機(jī)器人開(kāi)始在工業(yè)等眾多行業(yè)投入使用,人工智能的發(fā)展直接影響了眾多行業(yè),就在11月7日上的世界互聯(lián)網(wǎng)大會(huì),搜狗推出了AI合成主播產(chǎn)品,至此,人工智能的影響行業(yè)又再增添一項(xiàng)。

  “AI合成主播”是什么

  所謂“AI合成主播”,顧名思義,是用人工智能技術(shù)合成的新聞主播。“他”不僅能用和真人一樣的聲音進(jìn)行播報(bào),甚至,連唇形、面部表情、肢體語(yǔ)言也能夠與真人主播吻合,達(dá)到真假難辨的效果。“AI合成主播”的價(jià)值在于,可以大幅壓縮新聞播報(bào)視頻的后期制作成本,新華社副社長(zhǎng)劉思揚(yáng)表示:“從今天開(kāi)始,新華社AI虛擬主播就將正式上崗,成為新華社報(bào)道隊(duì)伍中新的一員。”

  “AI合成主播”的技術(shù)原理

  搜狗語(yǔ)音交互技術(shù)中心總經(jīng)理王硯峰透露,只需要由真人主播面對(duì)鏡頭錄制一段播報(bào)新聞視頻,“搜狗分身”技術(shù)憑借這段視頻,就能將真人主播的聲音、唇形、表情動(dòng)作等特征進(jìn)行提取,然后再通過(guò)語(yǔ)音合成、唇形合成、表情合成以及深度學(xué)習(xí)等技術(shù),克隆出具備和真人主播一樣播報(bào)能力的“AI合成主播”。

  王硯峰提到的“搜狗分身”技術(shù),是搜狗公司的前沿技術(shù)之一,它包含語(yǔ)音合成和圖像生成兩大引擎。

  (1)語(yǔ)音合成技術(shù):

  AI主播首先要實(shí)現(xiàn)的功能是在計(jì)算機(jī)有文本輸入時(shí),能夠以主播的音質(zhì)發(fā)出聲音。這項(xiàng)技術(shù)其實(shí)也是語(yǔ)音識(shí)別的過(guò)程,分為以下步驟:

  語(yǔ)音合成技術(shù)首先對(duì)主播的聲音進(jìn)行提取,再通過(guò)不斷的訓(xùn)練學(xué)習(xí),提取該主播聲音中的特征信息,進(jìn)而建立和主播語(yǔ)音相同的多維度語(yǔ)言語(yǔ)音模型,最終實(shí)現(xiàn)在輸入文本時(shí),能夠輸出該主播語(yǔ)音的功能。

  (2)圖像生成技術(shù):

  除了語(yǔ)音的學(xué)習(xí)訓(xùn)練,AI合成主播還需要學(xué)習(xí)主播的表情。和語(yǔ)言識(shí)別的性質(zhì)相同,圖像生成也要通過(guò)不斷的訓(xùn)練學(xué)習(xí)構(gòu)建模型來(lái)獲得。現(xiàn)階段可以采用人臉識(shí)別、三維人臉重建、表情建模技術(shù)對(duì)人臉進(jìn)行分析,建立人臉的多維度數(shù)據(jù)模型。最終在輸入文本,視覺(jué)信息和音頻之間構(gòu)建聯(lián)系。

  基于這兩種技術(shù),搜狗的AI分身能夠?qū)崿F(xiàn)和人類主播一樣,為輸出的文本中添加相應(yīng)的音色和語(yǔ)調(diào),豐富AI合成主播的形象,提高觀眾對(duì)AI合成主播的接受度,同時(shí),AI合成主播能夠識(shí)別中英文兩種語(yǔ)言,擴(kuò)大了AI合成主播的使用場(chǎng)景。

  人工智能發(fā)展還在繼續(xù)

  目前,機(jī)器人已經(jīng)開(kāi)始在工業(yè)領(lǐng)域大批量使用,并能夠完成人做不了的事情,不過(guò)機(jī)器人超越人類只是表現(xiàn)在較少的領(lǐng)域,例如制造業(yè)、服務(wù)業(yè)等,如果通用型機(jī)器人能夠全面超越人類,那么將是一個(gè)很大的震驚。

  人工智能從多個(gè)方面賦予機(jī)器人全新的能力,在感知檢測(cè)方面,通過(guò)視覺(jué)、力覺(jué)、聽(tīng)覺(jué)等多種傳感器,使機(jī)器人獲得了像人類眼耳鼻舌,以及聲音在內(nèi)等的感知系統(tǒng),機(jī)器人可以聽(tīng)懂人類的語(yǔ)言,可以識(shí)別人臉,這些功能的開(kāi)發(fā)進(jìn)一步擴(kuò)展了機(jī)器人的應(yīng)用場(chǎng)景。

  現(xiàn)在智能機(jī)器人已經(jīng)被開(kāi)發(fā)出很多新的功能,例如陪伴老人、下棋、教育小孩子、清掃地面、安防監(jiān)控等等,機(jī)器視覺(jué)、語(yǔ)音識(shí)別以及更多的感知功能的運(yùn)用,讓機(jī)器人和人的交互增加,提升了用戶使用智能產(chǎn)品的用戶體驗(yàn)。

  “AI合成主播”的應(yīng)用是“搜狗分身”的先創(chuàng)案例,它的技術(shù)使用不止于此。在之后,搜狗可以依靠這項(xiàng)技術(shù)復(fù)制各種用戶需要的人類形象,例如合成教師、合成客服等,而這些產(chǎn)品的出現(xiàn),意味著人工智能產(chǎn)品影響的行業(yè)范圍也會(huì)增加。

  AI機(jī)器人蘊(yùn)含著巨大的潛力,現(xiàn)階段人們已經(jīng)推出了各種專業(yè)領(lǐng)域的機(jī)器人,從工業(yè)機(jī)器人到教育機(jī)器人、養(yǎng)老機(jī)器人、搶險(xiǎn)機(jī)器人、醫(yī)療機(jī)器人等等,這些細(xì)分領(lǐng)域市場(chǎng)雖然遠(yuǎn)未有爆發(fā),但未來(lái)的前景是不可估量的。


本文由五度數(shù)科整理,轉(zhuǎn)載請(qǐng)標(biāo)明出處,違者必究!

評(píng)論

產(chǎn)業(yè)專題

申請(qǐng)產(chǎn)品定制

請(qǐng)完善以下信息,我們的顧問(wèn)會(huì)在1個(gè)工作日內(nèi)與您聯(lián)系,為您安排產(chǎn)品定制服務(wù)

  • *姓名

  • *手機(jī)號(hào)

  • *驗(yàn)證碼

    獲取驗(yàn)證碼
    獲取驗(yàn)證碼
  • *您的郵箱

  • *政府/園區(qū)/機(jī)構(gòu)/企業(yè)名稱

  • 您的職務(wù)

  • 備注