The Voice of Museum

作者:施登騰(中國科技大學互動娛樂設計系助理教授)

原文出處-教育部智慧博物館專案辦公室:http://moeimo2016.blogspot.tw/2018/01/the-voice-of-museum.html

一、數位語音不是新科技卻有新應用

還是習慣地不定時去看看Google Experiments網站中有什麼新的創意與技術,順便跟上互動科技的進度。Google的開放源分享總能吸引全世界數位程式高手貢獻腦力,許多尚未正式發表之技術或服務的測試成果,也都會展示在此實驗平台中。其他大型公司也會架設網站宣傳研發新訊,像是索尼Sony的Future Lab網站中所展示的「T」(很有神秘感的代號)就是一款尚未上市的互動投影產品,這款投影機裝置不僅有手勢控制功能,也搭載3D深度感測與機器學習技術,不僅可將桌面轉換成觸控桌,任何擺在桌上的物件也都能透過投影呈現進行相當直覺的互動設計。早在2016年就曾發表過的測試影片,就將桌上的「愛麗絲夢遊仙境繪本」印刷品變成有可觸控有動畫的互動物件,而2017年5月發表的Xperia Touch Projector就是款使用「T」技術的科技新品。

 

特殊的實體觸控方式以及Project Mapping技術,使得繪本閱讀相當互動有趣
圖片來源:截圖自https://www.youtube.com/watch?v=k-gTqrR9rKI
 
源於T技術的互動投影機已商品化~Xperia Touch(台灣已上市) 圖片來源:截圖自https://www.youtube.com/watch?v=dlGYgCf5xrM

 

Google Experiments平台所展示的新技術共有:AI Experiment、Android Experiments、AR Experiments、WebVR Experiments、Chrome Experiments、Arts & Culture Experiments,以及本文要分享的Voice Experiments等七大類。

很建議大家去體驗Google Experiments所展示的新數位技術 圖片來源:截圖自https://experiments.withgoogle.com/

 

其分享的研發成果不論是AI(數位技術趨勢)、Android(手機應用程式)、AR(ARCore技術測試與展示)、WebVR(網路版VR技術測試與展示)、Chrome(瀏覽器技術測試與展示)、Arts & Culture(全世界博物館數位典藏資料庫數位應用測試與展示)、Voice Experiments(Google Home語音助理應用測試與展示),都是相對應於Google目前發展的數位技術與產品,也維持Google以開放源方式讓全世界的開發者提供應用創意的構想。這其中,Arts & Culture Experiments平台上所見的數位典藏資料使用的創意,是在科技應用於人文藝術方面相當受到期待的技術研發成果,相信博物館界先進們有相當的熟悉其研發應用。

 

但本文主要是要先聚焦Voice Experiments 平台上所看到的創意,以及目前許多博物館在數位互動語音服務方面的進展等方面,然後再分享一些與業界曾討論過的想法。但是在拋出議題之前,先介紹四個在互動語音應用方面的創意,以建立深入了解數位語音互動服務技術的基本共識。

 

  • Story Speaker(Google Voice Experiments)

這個已發布上架的研發成果必須搭配「Google Home智慧管家」  這款智慧語音服務裝置或「Google Assistant ~Allo語音助理」 這款智慧語音服務App來使用的。

基本概念是將在Google Doc網路文件編輯器上所編寫的互動腳本(文字檔),透過Add-On加入Story Speaker應用程式,在Google Home智慧管家或Google Assistant語音助理上以語音播放,並且具有互動功能,可由閱聽者在許多段落自主選擇,而產生不同的劇情發展。

 
慣用的文字腳本編輯也能變成聲音朗讀並與讀者互動的作品 圖片來源:截圖自https://experiments.withgoogle.com/

 

而且這個互動腳本的編寫與應用,創作都不需要使用程式(Programing),即可在文件編輯上完成。

「文字朗讀功能」再加上「語音辨識功能」,就讓Google Home當個Story Speaker,而且還會在特定段落詢問閱聽者的決定,提供不同路線的故事內容,導引到不同的故事結局。

只要加載Story Speaker後Google Doc文本就能輸出成互動語音讀本
圖片來源:截圖自https://experiments.withgoogle.com/

 

  • Mystery Animal (Google Voice Experiments)

這個數位互動對話服務同樣得搭配Google Home 智慧管家來使用,在類型上應歸類Party Game。其規則與時下流行的20Q一樣,遊戲中由Google Home擔任關主,每關預設一個答案(都是動物,所以名為「Mystery Animal」),由參與者提問,由Google  Home回答,每個答案都必須在20個問題內答出。類似的Google Home應用遊戲還有「I’m Feeling Lucky!

Google Home及Google Assistant都是在I/O 2016推出,以「OK Google」啟動功能,不僅有語意邏輯判斷機制,也有自然語言處理(Natural Language Processing),Google Assistant 允許使用者以更貼近日常的口語表達方式下達指令。

 

 

 
目前各家的語音辨識技術都很成熟並廣泛應用
圖片來源:截圖自https://experiments.withgoogle.com

 

  • Amazon Echo Room Escape

在前面介紹了兩個Google Voice Experiments,接下來介紹一個更讓人期待未來語音助理功能發展的產品,也就是Amazon Echo Escape 。

Amazon推出自家的數位管家~ Amazon Echo已經是第二代產品了,由於售價低廉,所以當時引起市場的震撼。(2018.1.12訪價,Amazon Echo 99.9元美金、Google Home 129元美金、 Apple HomePod 349元美金,有興趣了解三款裝置功能比較者,可點選此最近的報導

最近Amazon Echo更是應用在密室脫逃活動上,推出「Echo Escape」。Amazon的智慧語音服務帶稱為Alexa,在遊戲過程中,Alexa會透過Echo給玩家許多指示並回覆問題。遊戲總共有三個不同難易的關卡:「牢房(簡易)」、「辦公室(中度)」、「車子(難)」,未來還會增加一個的車庫關卡。Alexa會以「Look, Inspect, Look at, Use」等等語音指示讓玩家去察看或尋找,玩家也可以透過「Help, Inventory, Stats」等等語音要求讓Alexa提供協助。想了解 Echo Escape產品資料可以點此,或者點選此觀看體驗分享部落格影片

有趣的是,在密室解謎過程中,只要說「Alexa」,就像呼喚密室小天使的名字一樣,無論當時Alexa是否正在進行指示或說明,玩家都可以立即跟Alexa對話。這方式就像賦予AI助理以人名與面貌般,Apple Siri, Microsoft Cortana, Samsung Bixby, IBM Watson也都是如此,倒是Google 除了Messaging Assistant App叫做Allo之外,就叫做Google Assistant, Google Now,連啟動都是說「OK! Google」或「Hello! Google」。

 

目前各家的語音辨識技術都很成熟並廣泛應用

圖片來源:截圖自https://experiments.withgoogle.com

 
在介紹完Amazon Echo與Google Home兩款智慧管家的創新應用後,也補充一條「新訊」,也就是這兩款智慧管家都比較輕巧便宜的新品推出,分別是Amazon Echo Dot(50元美金)與Google Home Mini(49元美金),有興趣進一步了解者,請點閱這個產品比較影片「Google Home Mini vs Amazon Echo Dot – Who gets your 50 dollors?」,Dave Lee在影片中對兩款產品的應用與優缺點都有很清楚的說明。

 

無論是把 Echo, Siri, Cortana稱之為語音助理(Voice Assistant)、虛擬助理(Virtual Assistant)、人工智慧助理(AI Assistant、AI-Powered Virtual Assistant),而且就像「The Surprising Repercussion of Making AI Assistants Sound Human」以及「Why Do So Many Digital Assistants Have Feminine Names」談到的議題,我們對人工智慧科技服務的具體想像,其實不是機器人助理,而是更接近「人」的虛擬助理,無論是在語音對答服務時更像真人的語調,或者是在命名與性別上。文章中提到所謂的「依存互動Contingent Interaction」,並引用研究說人類比較能夠對可以來回反應、對話與互動的人事物有所連結。報導也都提出不僅「擬人Humanlike」是具體目標,兼有個性與實用性(Personality and Utility)的虛擬助理服務也是眾所企求的。這也讓我想起在「AI上博物館」這篇分享中,提到Deeson 廣告公司的科技策略總監Ronald Ashiri在 「How Museums Are Using Chatbots」提到Giving chatbots a face(賦予聊天機器人具形貌)。就從上述所分享的實際案例來看,目前的人工智慧發展已讓「想像」逐漸成真。

那如果博物館有虛擬助理,該是什麼樣子呢?

二、數位語音助理在博物館的應用

這部分要舉例的是巴西奧美廣告公司與IBM公司合作,於2017年6月在巴西聖保羅州立Pinacoteca博物館(Pinacoteca do Estado de Sao Paulo) 推出數位導覽服務~「The Voice of Art / with WASTON」 。所使用的數位語音技術就是IBM研發的WATSON。

根據報導IBM等單位開發這個數位導覽服務的用途, 是為吸引未曾造訪博物館的巴西民眾(據調查全國有七成以上)來訪,因為民眾反映沒有導覽講解服務的博物館讓他們缺乏興趣或望之卻步。IBM研發團隊為了培養WATSON的應答能力,共花了6個月時間與西聖保羅州立博物館策展人和研究員合作,以大量的書籍、報導、傳記、訪談、網路資料、影片讓WATSON透過機器學習累積對於藝術作品豐富知識與答案,並擴大可對話與提供回覆的範疇,像在宣傳影片中就有一幕寫道「The History of Brazilian Art. 6 Months of WATSON Learning.」,也有研發者在訪問中說:「用預錄的聲音介紹藝術史,並不是真正的互動。」,所以希望讓「The Voice of Art / with WASTON」與使用者有更自然的對話,像是影片中的使用者就問了「這幅畫裡面有多少棵香蕉樹?」,小孩則看著肖像畫說畫中人物說「你喜歡踢足球嗎?」。

 

小朋友透過導覽器問說:「你喜歡踢足球嗎?」
圖片來源:截圖自http://www.adweek.com/creativity/
使用者問導覽器:「這幅畫裡面有多少棵香蕉樹?」
圖片來源:截圖自https://www.youtube.com/watch?v=m9

 

民眾要使用這套智慧語音導覽服務,是要在博物館入口索取,以獲得耳機以及搭載「The Voice of Art」應用程式的手機。在館內參觀特定展件時,使用者會接收到提醒訊息,然後就可以進行導覽互動。而這些由IBM研發的AI智慧語音服務,都是建置在IBM的Bluemix雲端平台上。
雖然報導並不多,但爬梳整理這些資料,進一步了解IBM將「The Voice of Art /  with WASTON」定義為「Cognitive Chatbot」(認知對話機器人)服務。其實這也是這份分享要特別說明清楚的:「Chatbot並不是AI Voice Assistant」。就像IBM將之上面舉列博物館服務視為Chatbot服務,這說明Chatbot應是為解決特定問題的單一服務功能,而語音助理提供更為廣泛多元的各項服務,像是前面提到的Apple Siri、Amazon Alexa、Microsoft Cortana,以及IBM WATSON等等。所以在 AI Chatbot開發與應用上,特別是使用Facebook Messenger Platform、Line Messaging API、Microsoft Bot Framework、Line Messaging API開發者,不該強求Chatbot像AI Voice Assistant一樣提供全能服務。

IBM網站上提供許多Watson案例
圖片來源:截圖自https://www.ibm.com/watson/

「The Voice of Art /  with WASTON」在巴西聖保羅州立博物館共提供7件作品的對話導覽服務,根據IBM官方說明,這個Chatbot功能也使用了Beacon以提供即時通知服務與定位服務,並在研發期間搜集整理了2 萬則問答去測試。而巴西奧美廣告的創意總監Claudio Lima也在訪談中提到已有其他6家巴西博物館聯繫希望使用此技術。不過目前尚未看到在其他博物館的應用。

其實「The Voice of Art /  with WASTON」並非IBM第一次將AI技術應用在博物館場域,早在2015年IBM的印度研究團隊就曾研發智慧語音導覽~USHER。USHER是款手機應用程式,可以透過陀螺儀、羅盤去判知使用者是行走中或靜止,也透過Wi-Fi訊號定位,以即時提供聲音導覽,像是「在你左手邊是XX畫像」。這款App當時是開發在Android平台,研究團隊也表明Wi-Fi定位並不是很準確,會考慮iBeacon技術作為解決方案。不過迄今,並未看到USHER正式發表。參考資料見「IBM’s WATSON Supercomputer Powers Usher, an Intelligent Museum Tour Guide App」,研究文獻見此「USHER: An Intelligent Tour Companion」,這篇研究是在

The 20th International Conference on Intelligent User Interfaces Companion研討會中發表的。

圖片來源:截圖自https://www.digitaltrends.com/mobile/usher

 

此外,IBM WATSON近來也推出「Art with Watson」專案,讓15位藝術家與WATSON共創藝術品,因為不在本文討論之列,有興趣者可以點閱網站訊息,或觀看說明影片

小結

「智慧語音服務是值得期待的博物館/美術館導覽數位技術。」因為目前所見智慧語音導覽服務尚未臻成熟,所以這篇分享還是以「值得期待」作為結論。

其實過去個博物館、美術館、展場所常用的單向式資訊服務(語音導覽機),已能藉由在導覽機或手機上輸入號碼、掃描QR Code、接受通知(Beacon Notification Push System)等技術提供使用者基本的導覽服務。進階者則更導入擴增實境(Augmented Reality)技術掃描畫作以取得多媒體導覽數位資訊(像是Smartify,相關報導在此),甚至也有將實境遊戲與多媒體導覽作結合的應用,名之為「情境語音導覽」。但畢竟這些都屬於「預設資料提供(Designated Information Provider)」的「工人智慧(業界術語)」,而非人工智慧。使用情境與功能主要是針對「查詢需求」的完備與簡便服務,相關人機互動不多,也多數未導入機器學習(Machine Learning)與自然語言處理(Natural Language Processing),雖不具備數位助理的功能,但能提供數位導覽服務。

「AI 上博物館」一文與本文分別討論chatbot的專屬導覽服務或者是導入像是Siri、Watson、Alexa、Cortana的 「全知型」 AI數位助理服務之案例,其實是介紹人工智慧、機器學習、數位語音服務技術的快速發展,有機會讓博物館與訪客有更深入的對話。也期待能出現非特定博物館而是整合既有數位典藏資源的「人工智慧語音助理」應用程式,並且也是款能面向公眾(public-facing)的導覽輔助功能選項,讓博物館發聲與觀眾對話。

台北故宮博物院也提供多種導覽服務
圖片來源:截圖自https://www.npm.gov.tw/Article.aspx?
整合30家博物館展品資料的App~Smartify只要拍攝展品即讀取詳細資料
圖片來源:截圖自https://smartify.org/

 

作者:施登騰(中國科技大學互動娛樂設計系助理教授)