繼Apple推出iPhone以觸控技術引爆人機介面革命,帶動全球消費性電子產業陸續從UI切入推出新產品技術。IEK產業分析師陳右怡分析,從2010年迄今,國際大廠加入聲控體感應用戰局,如微軟推出xbox 360 Kinect體感遙控電視遊戲、Google發展視覺搜尋應用技術、中國海爾腦波控制電視上市、Apple販售Siri智慧聲控iPhone 4S,甚至在2012年初Samsung、LG、聯想等家電大廠也將聲控體感技術注入電視介面,推出智慧聲控電視,而Intel宣布2012年底前,將推出具聲控功能的Ultrabook。由此可見,繼Apple觸控、Microsoft體感後,聲控已開始引爆第3次人機介面革命。

陳右怡指出,Apple以聲控引領全球UI革命,將推出聲控體感iTV。Siri技術源於美國國防部CALO人工智慧助理專案,最後由Apple收購。Apple Siri智慧聲控技術讓使用者透過自然對話,進行資料搜尋、天氣查詢、設定行程、打電話等服務,也結合在地資訊系統、GPS定位技術,並連結各種搜尋平台如Wolfram Alpha、維基百科與Yelp商家評比等,提供有別於Google關鍵字搜尋服務。Apple Siri具備人工智慧,可與使用者進行自然對話,並進一步採取行動。在策略布局方面,Apple仍持續從人機介面切入,將其他互動技術注入各種消費性產品,同時也表示將同時把聲控和體感注入今年將發表的Apple iTV。

Google以搜尋引擎技術為基礎,擴展網際網路各種應用,未來將擴大行動搜尋平台,發展各種行動搜尋的創新應用。Google本身所提供語音搜尋服務,以關鍵字為基礎,使用者必須唸出關鍵字,方能進行語音搜尋;同時也推出視覺應用程式,讓使用者透過拍照進行影像搜尋。
此外,Android Market上也有各種語音搜尋應用及語音助理服務應用軟體,使用者可根據個人需求下載,Android整合集散全球跨裝置跨廠牌之聲控App,擴大行動平台創新應用。Google擁有約60種語言互相轉譯的基礎,可把使用者發出的語音輸入翻成另一外一種語言輸出。

陳右怡說,2010年11月微軟推出具備聲控與體感技術的xbox 360 Kinect產品,Microsoft著眼於作業系統,針對不同的終端介面,提供不同的應用平台,其聲控技術採用自然語言處理,具備語音助理功能,主要特色是使用者必須透過下指令方式,進行操作,目前Microsoft這項技術應用在車載、電視遊戲機、電腦、手機4大類產品。

1.車載系統:Microsoft與Ford及KIA合作,分別推出Ford SYNC、KIA UVO兩大車載系統,Ford SYNC車載系統,讓使用者可透過語言指令與車載系統互動,取得交通狀況、商務資訊、及電影娛樂資訊等,譬如說出「HOME」,車子就會往回家方向行駛;KIA UVO系統則讓使用者可以透過語音指令,播放歌曲、撥接電話、將語言轉成文字發送簡訊。

2.電視遊戲機:Microsoft xbox 360 Kinect雖標榜體感技術,但已把TellMe聲控技術注入在這項產品當中,使用者可透過語言操作,如使用者說「xbox」就會打開目錄,xbox 360 Kinect也結合Bing搜尋、xbox LIVE、運動節目ESPN、隨身劇院HBO GO、影音平台Netflix 和Hulu Plus等。

3.智慧手機:Windows Phone 7則開始提供語音搜尋,Windows Phone 7.5則更進一步提供語音助理服務,讓使用者可以透過語音助理尋找商務資訊、撥打電話、打開特定應用程式,譬如使用者說出「Text」並緊接著說出在通訊連絡簿上的人名,以及想要發送的內容,即可將簡訊發送給特定人;或當使用者說出地點或店名,則會跳出地圖、方向指引、電話號碼等訊息。

4.電腦作業系統:Microsoft考量為了讓電腦族的手腕和頸部得到休息,Windows 7已具備聲控功能,如協助使用者不需鍵盤來撰寫Email、打開桌面(如Show Desktop)、打開各種應用程式(如Open Excel)等,Microsoft:聲控體感融入Metro UI,統一各種終端裝置之人機介面,由於各種終端裝置擁有不同的使用情境,Microsoft從作業系統切入,將聲控技術注入不同的終端裝置如手機、車載、電腦、遊戲機,Microsoft首先將聲控融合體感同時應用在xbox 360 Kincet電視遊戲機,顛覆全球使用者人機互動經驗。

Microsoft聲控乃是由使用者透過特定語言指令的方式,進行操作,但是尚未達到人與機自然互動的境界。對使用者來說,必須先熟悉特定語言指令,才能順利操作,甚至需更進一步了解整個互動介面中的功能選項以及各種功能選項間的操作步驟,方能從頭到尾透過聲控方式順暢執行。
國際大廠紛紛從人機介面、搜尋引擎、作業系統等層面切入,試圖在各種終端裝置設備上,發展出符合各種情境下的所有使用者習慣與行為的自然用戶介面(Natural User Interface,NUI)。

根據IEK觀察分析,未來人機介面將朝向多人多屏互動,聲控將成為跨終端人機互動方式。然而,面臨歐美日大廠在各種人機介面與技術的卡位戰中,台灣業者該如何切入聲控體感應用市場,IEK建議:

1.以全球市場為目標,研發跨品牌跨終端之聲控或體感App,歐美日大廠早在智慧手機、智慧電視、作業系統或3D體感技術等紛紛進行卡位大戰,台灣廠商可從國際大廠技術差異化切入,從使用者互動介面通用性出發,專注發展跨品牌與跨智慧終端產品的系統應用軟體,進軍全球。

2.瞄準華文市場,發展中文智慧語意暨語音辨識技術或平台,歐美大廠們雖掌握著人機介面、系統平台或全球搜尋資源,但仍受限於語言文化的限制,無法提供中文聲控互動介面與平台。因此,台灣廠商可發展具備人工智慧的中文語意暨語音辨識技術或平台,在全球聲控技術取得一席之地。
 

工商時報【江富滿】

聲控技術 再掀人機介面革命 

作者: 江富滿 | 中時電子報 – 2012年12月11日 上午5:30


arrow
arrow
    全站熱搜
    創作者介紹
    創作者 藍色小惡魔 的頭像
    藍色小惡魔

    藍色小惡魔 - 舒活札記

    藍色小惡魔 發表在 痞客邦 留言(0) 人氣()