翻譯、比價、身分辨識都能搞定
未來圖像辨識可望與手機應用程式結合,但重點在於要提供消費者「渴望擁有」的加值選項,才能讓圖像辨識成為殺手級應用。
拿起照相手機拍照、留下生活紀錄,已成為現代人生活的一部分,用手機來視訊通話也稀鬆平常。從產業端來看,蘋果(Apple)公司推出觸控式手機,整合各種娛樂服務;Google推出Android手機平台,要把網路服務串連起來,整個手機市場又進入新一波的競爭,各家無不思考手機還有哪些應用可能? 現在,它甚至可以擔任你的個人翻譯。當你在不同國家旅行,遇到不懂的單字,只要透過手機內建的數位相機鏡頭,對著陌生單字拍攝,透過圖像辨識功能,就可立刻在螢幕上顯示翻譯結果,再也不用帶著大本字典或是慢吞吞地在電子翻譯機輸入單字。
拆解文字技術速遞資訊
這項新技術是由諾基亞(Nokia)中國研究中心所開發,用照相手機拍攝任何物體表面的文字,經由光學辨識,將影像的文字抽取識別,再透過內建的翻譯軟體轉換成不同語言。諾基亞中國研究中心負責人裴斯博(Seppo Pienimaa)表示,該中心針對亞洲語言的研究已長達八年,包括漢語、粵語、英語、泰語、越南語等,希望能夠創造多語言通用的服務,讓使用不同語言的人,可以在生活中更便利地溝通。
諾基亞中國的研發人員表示,現在已經能將中文與英文的文字影像進行拆解辨識,可逐字翻,也可以配上人工智慧的詞組辨識,大從海報看板、小至報章雜誌的說明文字都可翻譯。這項技術最快將可在今年搭配產品問世,屆時可望免除參加北京奧運的外國觀光客看不懂中文菜單的困擾。
透過影像識別的技術,再加上傳輸到某些終端或網路辨識,照相手機的應用還可以作為更精確的個人身份識別。日本松下電器(Panasonic)和夏普(Sharp)公司都已經開始製造具備「面部識別」功能的手機,透過內建相機,來捕捉使用者五官的輪廓與距離,再透過軟體運算,辨別識使用者是否為原手機持有者。
這項研究的應用,不單是打算以手機取代翻譯機,研究人員更試圖讓手機扮演搜尋引擎的角色。諾基亞在加州帕拉阿圖(Palo Alto)的研發中心,就推出一個名為「Point Find」的計畫,只要以照相手機拍攝生活周遭的景物,就可以即時從網路上得到相關資訊。去年秋天,數家印度寶萊塢(Bollywood)電影片廠嘗試了一項新服務:手機用戶將相機鏡頭對準電影海報,然後就可以下載該部電影的主題曲作為手機鈴聲。研究人員在實驗室示範,把手機的相機鏡頭對準一只紅色的鞋子,手機立即可以從網路上搜尋出附近鞋店的資料;對準店面,就能得到門市營業時間的訊息。
諾基亞承諾這項計畫將在三年內實現,而這個概念型科技已經吸引很多人的注意。因為它讓消費者簡單地使用照相手機,得到他們感興趣的資訊。甚至當消費者想要購買某件海報上的洋裝,照相手機也可以搜尋最實惠的價格和購買方式,比起現有搜尋模式(消費者在網路上尋找關鍵文字)便利許多。不過,除了影像辨識,這項技術需要大量科技的配合,例如GPS定位、人工智慧演算法。MIC研究顧問王勝宏表示,利用影像辨識在實體世界搜尋,需要龐大的資料庫和運算能力,更要能夠跨平台的分享資訊,不是單一企業可以做到的。
未來圖像辨識可望與更多應用程式結合,但重點在於要找到利基,提供特定族群消費者一個「渴望擁有」的加值選項,「好用」才能讓圖像辨識成為新的殺手級應用。
|