2017-05-22 15:55:11
作者:zq
隨著人工智能的迅速崛起,新一輪核心技術(shù)變革已經(jīng)躍然眼前。語音技術(shù)作為最核心的入口,成為科技巨頭們爭相攻下的堡壘。亞馬遜,蘋果、微軟、谷歌、百度等多家科技巨頭也紛紛進軍語音助手市場,該領(lǐng)域的競爭日趨激烈。2016年是聊天機器人接管硅谷的一年,但語音技術(shù)能否從根本上撬動人與機器交互的龐大根基卻尚難定論。當激進的瞭望者們描述:物聯(lián)網(wǎng)爆發(fā)之際,語音技術(shù)何等不可思議,將徹底顛覆傳統(tǒng)復(fù)雜的手動操
隨著人工智能的迅速崛起,新一輪核心技術(shù)變革已經(jīng)躍然眼前。語音技術(shù)作為比較核心的入口,成為科技巨頭們爭相攻下的堡壘。亞馬遜,蘋果、微軟、谷歌、百度等多家科技巨頭也紛紛進軍語音助手市場,該領(lǐng)域的競爭日趨激烈。
2016年是聊天機器人接管硅谷的一年,但語音技術(shù)能否從根本上撬動人與機器交互的龐大根基卻尚難定論。當激進的瞭望者們描述:物聯(lián)網(wǎng)爆發(fā)之際,語音技術(shù)何等不可思議,將徹底顛覆傳統(tǒng)復(fù)雜的手動操作模式等等,而一些冷靜的現(xiàn)實派確認為:這些機器人并不怎么會聊天。
科技巨頭們的“語音”交互戰(zhàn)
為了能夠在這個即將到來的生態(tài)系統(tǒng)中搶占制高地,各大科技巨頭越來越重視語音技術(shù)發(fā)展。蘋果Siri依托于iPhone,亞馬遜Alex依托于Echo設(shè)備,在搜索和語言領(lǐng)域占據(jù)技術(shù)優(yōu)勢的谷歌卻在硬件發(fā)展上晚了一拍,比較為消費者所熟知的還是Google Home設(shè)備上的語音服務(wù),而微軟則眼光獨到,其人工智能旨在幫助人們做到更好,而不是與人競爭。
Facebook近日宣布啟動新的平臺ParlAI,加大語音識別研發(fā)力度,使計算機能與人進行有意義的對話。而微軟與谷歌則展開了一場實力角逐。
在技術(shù)上,微軟有與谷歌TensorFlow想匹敵的人工智能開源開發(fā)工具CNTK,以及提供全部人工智能技術(shù)的Azure云。在業(yè)務(wù)上,微軟現(xiàn)在有三款聊天機器人,主打情感計算的小冰、主打商務(wù)助理的小娜,還有在垂直領(lǐng)域的深度應(yīng)用智能客服。在神經(jīng)網(wǎng)絡(luò)翻譯領(lǐng)域,Microsoft Translator已經(jīng)可以與Google Translate相匹敵。
百度則順利度過了和語音技術(shù)的“七年之癢”, 從比較初的基于云端識別的互聯(lián)網(wǎng)應(yīng)用到如今成功將 HPC 技術(shù)移植到深度學習平臺,百度在語音技術(shù)方面的提升相當可觀。
此外,智能手機的語音技術(shù)也逐漸走向產(chǎn)品化,像老羅發(fā)布新機堅果Pro,搭載“閃念膠囊”功能,采用訊飛輸入法語音識別技術(shù),一分鐘400字,抓住你的靈感一現(xiàn)。閃念膠囊其實就是一個語音技術(shù),包括傳聞已久的蘋果 Siri 音響也有幾分延續(xù)語音產(chǎn)品化熱度的可能。
吳恩達表示,“至少在中國,我們會在接下來幾年時間普及語音識別應(yīng)用,讓人機溝通成為一件非常自然的事。你會很快習慣與機器流暢交流的時光,而忘記以前是如何與機器交互的。”
各大科技巨頭已經(jīng)紛紛搶灘智能語音市場,而人工智能的進步與發(fā)展也讓語音技術(shù)的識別突飛猛進。不過,從語音技術(shù)之爭到“語音技術(shù)+硬件”的較量,能夠看出只有能走進廣大消費者的語音技術(shù)才有可能真正打響第一槍。
語音技術(shù)發(fā)展痛點:深度算法+噪音識別+語義理解
回歸到現(xiàn)實人類與機器的語音交互場景,從第一批興起的智能手機語音技術(shù)到聊天機器人,更多時候是用戶適應(yīng)它們的習性,而不是反過來適應(yīng)用戶的習性。
聊天機器人的回復(fù)“牛頭不對馬尾”是常有的事,受到環(huán)境影響發(fā)揮失常;受到噪音干擾發(fā)揮失常;深度算法的復(fù)雜性限制實際應(yīng)用等都是亟待解決的問題。
比如“雞尾酒會效應(yīng)”人類可以在諸多人的講話中屏蔽掉次重點,捕捉比較想聽到的信息。而機器人面對嘈雜的語音技術(shù)怎么分出個主次搜索到有用信息?從目前市場上的聊天機器人來看,在噪音處理環(huán)節(jié)并沒有很理想。
對于復(fù)雜的語音環(huán)境來講,本身就很難達到普適性的要求。語言作為人類的天賦能否被人工智能所真正理解和學習,這將是語音交互中比較難攻克的問題之一。而對于極度復(fù)雜“語義理解”和“語音識別”來說則很有可能掉入“雞和蛋”的怪圈。
“認知方面的突破,現(xiàn)在還不知道猴年馬月?!闭Z音領(lǐng)域的權(quán)威專家黃學東坦言。
語音技術(shù)是在向移動客戶端叫板嗎?
剝開種種限制性條件,語音技術(shù)將要馳騁何方?假如深度算法難題、噪音處理問題、語音理解問題被一一攻克,那么語音技術(shù)將要接誰的盤?
PC時代我們更多使用文字,而移動時代,隨著語音技術(shù)的發(fā)展,我們將更少使用鍵盤(實體和虛擬),更多地使用語音與機器自然交互。隨著語音技術(shù)的不斷成熟,承載大批量APP的移動客戶端則有可能走向消亡。
比如:打車軟件、叫外賣、網(wǎng)上購物、播放音頻視頻文件……只需要你語音指示,后臺便可以執(zhí)行所有命令!就像可以幫你打電話的Siri,未來或許你只需要一個很小巧的隨身裝置,就像“借東西的阿莉埃蒂小人” 一樣,可以與你并肩作戰(zhàn),聽得懂你的話,成為你耳朵、眼鏡、四肢的延伸與萬物互聯(lián)。
這不是科幻片或者動漫里的專屬場景,在數(shù)據(jù)資源、計算資源和算法技術(shù)的合力推動下,這一切都將可能成為現(xiàn)實。正如語音識別領(lǐng)域的技術(shù)大咖黃學東所言: “語音交互的發(fā)展是一個自然的過程,這是因為語音交互是一個無需觸碰設(shè)備即可完成的體驗,它可以讓人擺脫設(shè)備的枷鎖?!?/p>
從黃學東的論點中語音概念再一次被升華,也就是語音技術(shù)發(fā)展的終極意義:從根本上改變?nèi)藗兣c機器交互的方式。
筆者來看,語音技術(shù)之于移動客戶端,正如智能觸屏之于物理鍵盤,只要發(fā)展夠成熟,取代也只是時間問題。而目前我們更像是站在這個劃時代的轉(zhuǎn)折點上,一次徹底的跨越來源于更替技術(shù)的徹底醇熟,目前來看火候未到。
本文推薦科技巨頭搶灘智能語音市場,能否改變?nèi)伺c機器語音市場方式?僅代表作者觀點,不代表本網(wǎng)站立場。本站對作者上傳的所有內(nèi)容將盡可能審核來源及出處,但對內(nèi)容不作任何保證或承諾。請讀者僅作參考并自行核實其真實性及合法性。如您發(fā)現(xiàn)圖文視頻內(nèi)容來源標注有誤或侵犯了您的權(quán)益請告知,本站將及時予以修改或刪除。
猜您喜歡
最新推薦
時空回轉(zhuǎn),“肌”活密鑰 | 深圳陽光醫(yī)院專利新品即將重磅發(fā)布
2024-11-07
2024-11-06
2024-10-28
2024-10-28
2024-10-21
2024-10-17
2024-10-17
相關(guān)新聞
隨著人工智能的迅速崛起,新一輪核心技術(shù)變革已經(jīng)躍然眼前。語音技術(shù)作為最核心的入口,成為科技巨頭們爭相攻下的堡壘。亞馬遜,蘋果、微軟、谷歌、百度等多家科技巨頭也紛紛進軍語音助手市場,該領(lǐng)域的競爭日趨激烈。2016年是聊天機器人接管硅谷的一年,但語音技術(shù)能否從根本上撬動人與機器交互的龐大根基卻尚難定論。當激進的瞭望者們描述:物聯(lián)網(wǎng)爆發(fā)之際,語音技術(shù)何等不可思議,將徹底顛覆傳統(tǒng)復(fù)雜的手動操
性價比逆天!小骨S即將上市:后置指紋,千元以內(nèi)在今年4月份的時候,ivvi手機推出了旗下首款裸眼3D手機K5,該機主打裸眼3D功能,憑借著驚艷的外觀設(shè)計、豐富的3D內(nèi)容以及出色的裸眼3D體驗,在市場中取得了一致的好評。現(xiàn)在,經(jīng)過短暫的休整之后,ivvi手機將再度發(fā)力,推出又一款力作小骨S。蘋果禁止微信打賞另有所圖,征收30%的分成是否合理?本以為蘋果是清高的蘋果,所以見不得在自
1月19日消息,中興于17日下午在海南聯(lián)合中國電信發(fā)布了三款新機,2499元主打語音操控的星星2號電信版、2999元的主攻商務(wù)安全的天機3,、...
語音技術(shù)給人類的生活帶來了很多美好的想象。人們期許能在任何場景利用語音技術(shù)與機器人交流,給人類提供便利,就像電影《她》里描述一樣。不過現(xiàn)實中,最有可能讓語音技術(shù)落地的,反而是一個對語音識別要求并不高的群體。針對3-7歲的小朋友,利用語音識別、語義理解等技術(shù),與小孩進行溝通互動,提供陪伴和早教的服務(wù)。這樣的應(yīng)用場景,聽上去非常有潛力,尤其在中國,獨生子女的陪伴一直是社會關(guān)注的問題。上海元
8月4號,支付寶9.9版正式對外啟動灰度測試。最新版支付寶最大的變化便是首次推出了新的智能語音機器人服務(wù),用戶只要以語音的方式就能夠一步直達所需要的服務(wù)。正式版本將于8月中旬發(fā)布。這將是支付寶史上的又一重大創(chuàng)新之舉。
iRobotCEOColinAngle已經(jīng)不只一次公開表示,要把自家的明星產(chǎn)品Roomba自動吸塵器變成智能家居的一員,而最近的消息是,iRobot將集成亞馬遜的Alexa智能語音助手以及更先進的地圖識別功能,離目標又進了一步。就目前來講,iRobot已經(jīng)成為很多美國家庭中最常見的家用電器,巨大的普及量讓它有潛力成為整個智能家居系統(tǒng)中的重要組成部分,而iRobot也意識到了這一點
Vring戒指是最近在Kickstarter上進行眾籌的一款產(chǎn)品,與其他戒指不同的地方在于它是通過語音實現(xiàn)控制的。Vring公司在宣傳中宣稱它是第一款專注于語音控制的穿戴設(shè)備,雖然這在很大的程度上是一個宣傳的噱頭,但是從Vring這款產(chǎn)品來看倒也合情合理。這款智能配件——Vring戒指,外形稱不上過于龐大或者臃腫。在公司的宣傳視頻中,它能夠與用戶的智能手機配對,為用戶提供很多方便。
伴隨父母年紀越來越大,身體或多或少總有點不適,有些慢性疾病可能一直需要藥物來治療/維持,但由于年齡問題,爸媽總是忘記按時吃藥,而我們又時常迫于工作/生活的壓力,無法長時間陪伴在身邊,父母的健康問題是否已經(jīng)引起了你的關(guān)注?如今,在科技快速發(fā)展的今天,全新的智能產(chǎn)品已經(jīng)來到我們面前,智能WiFi藥盒或許能給生活帶來一些新的改變。它可以為老人管理吃藥時間、用藥記錄、健康管理等,藥罐可一直放入
驅(qū)動中國2017年7月24日消息2017上半年TMT產(chǎn)業(yè)融合峰會在昨日準時召開,會上不僅發(fā)布了上半年五大行業(yè)市場發(fā)展報告,還評選了十大優(yōu)秀新聞和十大優(yōu)秀創(chuàng)新產(chǎn)品,其中ivvi獲得了下半年最值得期待手機品牌推薦。ivvi副總裁在報告中講訴了公司的發(fā)展戰(zhàn)略。按照ivvi的戰(zhàn)略規(guī)劃來看,ivvi希望打通整個綜合性的知識領(lǐng)域——打通數(shù)據(jù)的采集、成像、應(yīng)用,把新的人機交互方式帶到未來的通訊領(lǐng)
從今天開始,所有iPhone用戶都可以在亞馬遜主應(yīng)用使用Alexa智能語音助手。Alexa語音助手整合進亞馬遜App這款語音助手可以購買和追蹤包裹,但也可以從事Alexa的多數(shù)傳統(tǒng)功能,比如講笑話、報天氣、預(yù)測奧斯卡獎和“超級碗”的贏家。它還能播放音樂、控制物聯(lián)網(wǎng)設(shè)備,為亞馬遜應(yīng)用賦予1萬多項技能。亞馬遜應(yīng)用內(nèi)置的Alexa應(yīng)用最初無法訪問DoorLockAPI。這款上月末
熱門推薦
最新招商信息
相關(guān)推薦