iVoka語(yǔ)音交互技術(shù)簡(jiǎn)介 iVoka是已經(jīng)搭載在上汽榮威車(chē)型上inkaNet系統(tǒng)的3.0版本,相比上一代系統(tǒng),它的亮點(diǎn)是加入了智能語(yǔ)音交互系統(tǒng),即通過(guò)語(yǔ)音命令來(lái)代替?zhèn)鹘y(tǒng)按鍵的輸入方式。不過(guò)這種語(yǔ)音交互方式也對(duì)系統(tǒng)提出了更高的要求,如果想取得更好的用戶體驗(yàn),系統(tǒng)就需要準(zhǔn)確的識(shí)別人類(lèi)語(yǔ)言所要表達(dá)的意思,同時(shí)做出合理且人性化的反饋,而且系統(tǒng)的思考時(shí)間也不可過(guò)長(zhǎng)等等。當(dāng)然要實(shí)現(xiàn)這些并不容易,我們可以把這些目標(biāo)看作一個(gè)標(biāo)桿,越接近它,就說(shuō)明這套系統(tǒng)的人機(jī)智能化越發(fā)達(dá)和人性化。 目前iVoka系統(tǒng)可以對(duì)打電話、發(fā)短信、導(dǎo)航、資訊查詢(xún)、聽(tīng)音樂(lè)、聽(tīng)廣播實(shí)現(xiàn)語(yǔ)音控制,其它功能暫時(shí)仍需要手動(dòng)輸入指令,下面我們就來(lái)看看iVoka語(yǔ)音控制功能的表現(xiàn)究竟如何。 簡(jiǎn)單來(lái)說(shuō),我們可以把裝載在車(chē)輛上的這套iVoka系統(tǒng)看成是一部安裝有安卓系統(tǒng)的智能手機(jī),通過(guò)觸摸式屏幕我們可以對(duì)其進(jìn)行隨心所欲的控制。其中的人機(jī)交互系統(tǒng),更像是你的一個(gè)貼心助手,對(duì)你的命令或者需求作出相對(duì)人性化甚至是幽默式的回應(yīng),而且用戶無(wú)需拘泥于死板的語(yǔ)法結(jié)構(gòu),只需用簡(jiǎn)單或者日常用語(yǔ)向機(jī)器表達(dá)自己的訴求。 ● 接/打電話 要實(shí)現(xiàn)這個(gè)功能首先需要通過(guò)藍(lán)牙將手機(jī)中的聯(lián)系人信息傳送到iVoka車(chē)載系統(tǒng)中,通過(guò)語(yǔ)音命令iVoka來(lái)?yè)艽螂娫挕.?dāng)有電話打進(jìn)來(lái)時(shí),系統(tǒng)也會(huì)通過(guò)語(yǔ)音來(lái)詢(xún)問(wèn)用戶是否接聽(tīng)此電話。 ● 接收/發(fā)送短信 通過(guò)語(yǔ)音來(lái)發(fā)送和獲取短信內(nèi)容,可以使駕駛員的注意力更多的集中在車(chē)輛駕駛上。但是在語(yǔ)音輸入短信內(nèi)容時(shí),用戶必須使用標(biāo)準(zhǔn)的普通話(當(dāng)然也不至于到新聞聯(lián)播的水平),否則系統(tǒng)會(huì)產(chǎn)生錯(cuò)誤識(shí)別的情況發(fā)生,同時(shí)由于中文多音字的原因,也會(huì)偶爾使系統(tǒng)對(duì)用戶的語(yǔ)音命令產(chǎn)生誤解。 ● 導(dǎo)航 進(jìn)入導(dǎo)航功能后,在搜索具體目的地時(shí)有兩種途徑,一是通過(guò)語(yǔ)音與iVoka車(chē)載系統(tǒng)進(jìn)行人機(jī)交互;另一種則可以遠(yuǎn)程呼叫客服人員,通過(guò)人與人的溝通,將目的地信息下載到導(dǎo)航地圖中來(lái)實(shí)現(xiàn)車(chē)輛導(dǎo)航。 ● 資訊查詢(xún) 通過(guò)語(yǔ)音交互系統(tǒng)可以實(shí)現(xiàn)的資訊查詢(xún)包括了當(dāng)前時(shí)間、日期、某城市的天氣情況以及航班信息,應(yīng)該說(shuō)內(nèi)容相對(duì)有限。不過(guò)隨著功能的逐漸豐富,未來(lái)還會(huì)加入如股票、新聞等更多的可以通過(guò)人機(jī)交互系統(tǒng)來(lái)完成的資訊查詢(xún)和獲取。 ● 聽(tīng)音樂(lè)、廣播
收聽(tīng)音樂(lè)分為兩種情況,一是讀取本機(jī),即SD卡上的音樂(lè)文件,并且可以通過(guò)語(yǔ)音命令直接說(shuō)出想要聽(tīng)的歌曲名稱(chēng),此時(shí)iVoka系統(tǒng)便會(huì)播放此音樂(lè)。另一種是通過(guò)系統(tǒng)的3G網(wǎng)絡(luò)在線收聽(tīng)網(wǎng)絡(luò)音樂(lè),只是還不支持網(wǎng)絡(luò)音樂(lè)搜索功能。 收聽(tīng)廣播時(shí),用戶只需說(shuō)出電臺(tái)的頻率,系統(tǒng)便可直接轉(zhuǎn)入相應(yīng)的電臺(tái),同時(shí)可以將喜愛(ài)的電臺(tái)通過(guò)語(yǔ)音命令進(jìn)行收藏。今后用戶還可以發(fā)出“收聽(tīng)北京音樂(lè)臺(tái)、北京交通臺(tái)”的類(lèi)似指令,讓系統(tǒng)直接跳轉(zhuǎn)至對(duì)應(yīng)電臺(tái),無(wú)需用戶記下電臺(tái)的頻率。 ● 像操作智能手機(jī)一樣來(lái)實(shí)現(xiàn)其它功能 這套iVoka車(chē)載智能系統(tǒng)采用開(kāi)放式的安卓系統(tǒng),通過(guò)安裝各種第三方軟件可以豐富它的功能,再加上觸控式的屏幕,對(duì)于年輕人來(lái)說(shuō),上手很容易,且就像操作智能手機(jī)一樣輕松自如。 ● 日后與CAN總線的融合為用戶提供更多行車(chē)數(shù)據(jù) ● 目前它還像一個(gè)兩三歲的孩子 日后通過(guò)“教育”會(huì)讓它變得更加聰明和智能化 這套系統(tǒng)目前仍處于測(cè)試階段,所以還存在諸多不完善的地方,而主要問(wèn)題集中在以下幾點(diǎn): ① 雖然iVoka系統(tǒng)已經(jīng)可以識(shí)別一個(gè)意思的多種表達(dá)方式,使用戶不必糾結(jié)于嚴(yán)謹(jǐn)?shù)恼Z(yǔ)法結(jié)構(gòu),但是由于中文的博大精深,難免會(huì)出現(xiàn)無(wú)法識(shí)別的語(yǔ)言表述情況。 ② 目前iVoka系統(tǒng)只支持普通話,而且每一個(gè)語(yǔ)音指令都需要用戶字正腔圓的朗讀清楚,否則系統(tǒng)就會(huì)出現(xiàn)識(shí)別錯(cuò)誤或者無(wú)法識(shí)別的情況。 ③ 系統(tǒng)的反應(yīng)速度受制于硬件的原因還不夠令人滿意,用戶發(fā)出的每條指令,系統(tǒng)都需要至少2秒鐘的時(shí)間才可以做出反應(yīng)。 ④ 在人機(jī)交互系統(tǒng)方面還不夠人性化,由于iVoka的語(yǔ)音回復(fù)詞庫(kù)是預(yù)先植入到系統(tǒng)內(nèi)的,而詞庫(kù)的豐富程度也就決定了它是否可以像人類(lèi)交談那樣賦有多種情感。 ⑤ 這套iVoka系統(tǒng)通過(guò)語(yǔ)音交互來(lái)實(shí)現(xiàn)的功能還比較有限,像接、打電話等常用到的功能外,其它諸多功能仍需通過(guò)傳統(tǒng)的手寫(xiě)方式來(lái)實(shí)現(xiàn)。 目前iVoka的理解力、表達(dá)能力以及智商還像一個(gè)兩三歲的孩子,成人之間的話語(yǔ)可能并不能被它所理解,自然也無(wú)法做出合理的回應(yīng),更談不上深入或者帶有情感的交流。不過(guò)通過(guò)不斷對(duì)它進(jìn)行語(yǔ)言上的“教育”以及邏輯思維能力的“培養(yǎng)”,相信它會(huì)越來(lái)越接近人類(lèi)的智商,使人與機(jī)器間實(shí)現(xiàn)更輕松的互動(dòng)。 ● 使用費(fèi)用 該系統(tǒng)采用聯(lián)通3G套餐業(yè)務(wù),頭兩年免費(fèi),其中每月有100分鐘通話時(shí)間和400兆流量。根據(jù)目前所反饋的情況,這樣的資費(fèi)內(nèi)容可以滿足絕大部分用戶的使用需求。 |
大家都在看的詞條同類(lèi)別熱門(mén)詞條 |