目前,奪戰(zhàn)基于人工智能技術(shù)的硬件語音識(shí)別和圖像識(shí)別已經(jīng)達(dá)到了較為成熟的階段。據(jù)白皮書介紹,目前國際領(lǐng)先企業(yè)圖像分類的錯(cuò)誤率已降至3.0%,人臉識(shí)別率達(dá)到99%左右,語音識(shí)別的錯(cuò)誤率下降到5%左右,百度公司的錯(cuò)誤率僅為3.7%,并且在方言識(shí)別方面也具有優(yōu)勢。圖像識(shí)別和語音識(shí)別技術(shù)的發(fā)展給人機(jī)交互模式創(chuàng)造了新的可能,在無法使用鍵盤輸入或者雙手被占用的情況下,語音輸入將為設(shè)備控制提供新的可能,例如在家電、汽車、無人機(jī)、快遞分揀、機(jī)器人等領(lǐng)域,人工智能將成為強(qiáng)大的功能引擎。
2017年,隨著人工智能和硬件技術(shù)的發(fā)展,企業(yè)開始走向細(xì)分市場的打磨,推出許多特定場景下的產(chǎn)品,突出智能硬件的核心功能和價(jià)值,最明顯的領(lǐng)域是在家庭消費(fèi)市場中,出現(xiàn)了多種智能硬件并存、取長補(bǔ)短、相互配合、協(xié)調(diào)發(fā)展的局面,例如智能電視、智能音箱、智能家電、智能攝像頭的普及和運(yùn)用。

天貓精靈
對于這一現(xiàn)象,白皮書中也有進(jìn)一步解釋和說明。人類對電子設(shè)備的可視時(shí)長是有限的,PC與電視每天消耗了7-8個(gè)小時(shí),手機(jī)占用了碎片化時(shí)間,額外創(chuàng)造出3-4個(gè)小時(shí),3者相加已接近人類娛樂時(shí)間的峰值,若新一代智能硬件依舊依托于可視經(jīng)濟(jì),則必然會(huì)受到時(shí)長的制約,這也是制約VR設(shè)備成為新一代家庭娛樂終端的重要原因。因此,語音功能的成熟為新一代智能硬件提供了“無屏化/弱屏化”的發(fā)展模式,不再以人類視覺為注意力核心,在有限的時(shí)間內(nèi)進(jìn)一步加身人類與互聯(lián)網(wǎng)的融合程度,實(shí)現(xiàn)多路徑、多渠道的信息傳播和獲得。
當(dāng)然,面對智能硬件的多元化趨勢,也對核心技術(shù)提出了更高要求。例如,云端協(xié)同的計(jì)算能力、新架構(gòu)新器件的加速運(yùn)用、終端芯片的異構(gòu)計(jì)算能力、軟硬件的深度融合等等。此外,計(jì)算機(jī)視覺技術(shù)雖然取得了長足進(jìn)步,但對于今后來說,計(jì)算機(jī)視覺技術(shù)還應(yīng)突破“看懂”能力;同樣,自然語言處理技術(shù)的“聽懂”能力也十分重要,通過新的交互模式產(chǎn)生新的碰撞,為人類生活帶來新的生機(jī)。
對于智能家居產(chǎn)品的天然優(yōu)勢,白皮書認(rèn)為,智能音箱作為控制中心有3個(gè)天然優(yōu)勢,包括成本較低、適合引入語音技術(shù)、智能語音芯片和語音處理算法能進(jìn)一步提高智能音箱的應(yīng)用能力等。甚至有部分芯片企業(yè)和語音技術(shù)企業(yè)合作,將麥克風(fēng)陣列和遠(yuǎn)場語音識(shí)別等功能集成為芯片模組,方便智能音箱企業(yè)使用。此外,智能音箱企業(yè)也正在逐步加深與家電行業(yè)的合作,實(shí)現(xiàn)無縫接入和集中控制。
總之,以語音交互、自動(dòng)控制功能為主的家居硬件創(chuàng)新將逐步增多,控制型硬件從環(huán)境感知類設(shè)備向語音控制類設(shè)備轉(zhuǎn)移,圍繞智能音箱、智能語音為核心的新型智能家居應(yīng)用生態(tài)開始逐步建立起來,智能家居的入口爭奪戰(zhàn)將越來越激烈。
*部分參考資料來源于《智能硬件產(chǎn)業(yè)發(fā)展白皮書(2017)》(中國信息通信研究院發(fā)布)


相關(guān)文章




精彩導(dǎo)讀
熱門資訊
關(guān)注我們