Friday, July 22, 2005

CGI conference 參加報告

雖然我總是懶得翻譯我的blog,不管是中翻英或英翻中(尤其我的中文老是莫名其妙地、寫寫就會變成很像英文,要是英翻中通常讀起來拗口得要命)但無奈為 了交心得報告,好讓我去美國參加CGI conference的旅費能夠獲得補助,今天花了一天把前兩個裡拜寫的東西翻成中文,在經過修修改改之後成為下面的報告。

2005年國際電腦圖學會議 (Computer Graphics International 2005, CGI) 於六月22至24日在位於美國紐約州的Stony Brook大學召開。本次會議為Stony Brook大學「圖學週」(“Graphics Week”) 活動中的一部份,其餘活動還包括了「2005年國際體積圖學研討會」(International Workshop on Volume Graphics 2005) 及「點繪製圖學座談會」(Point-Based Rendering Symposium 2005),總計為期一週。國際電腦圖學會議(CGI)之議題範圍較其餘二會廣泛,其規模雖不比ACM SIGGRAPH、EUROGRAPHICS等大型會議在同一時刻進行多項議題,與會專家學者卻皆在電腦圖學領域中具有重要影響力:包括Stony Brook大學的Arie Kaufman、日內瓦大學的Nadia-Magnenat-Thalmann與瑞士國家科學院的 Daniel Thalmann、紐約大學的Demetri Terzopoulos、東京大學的西田友是教授等等。

本人於2005年一月份投稿此篇論文︰“Toward Gesture –Based Behavior Authoring”,並於四月份獲悉錄取的消息。此篇論文針對建立虛擬動畫角色之行為提出一新的編輯方式,期望使無程式撰寫能力的一般使用者,也能夠以 簡單的方式(滑鼠軌跡)進行編輯。利用此論文所提出的方法,使用者不需透過程式指令的輸入,而只需以滑鼠在螢幕上拖曳、點選、及繪製符號,即可達成編輯的 工作,產生栩栩如生的三維人物、動物的行為動畫。本人視此篇論文為相關領域中,首次企圖以滑鼠軌跡的方式解決此類問題的作品。過去的主要作品為提供複雜而 強大的程式撰寫工具,其他提出的做法則抑或過度簡單、抑或缺乏了本篇包含的高度互動性。

由於此篇論文的做法於相關領域中無人曾提出,也是本人在跌跌撞撞中、不斷摸索中完成,使得此初探性的作品具有主要兩個極端的特性。首先,許多人(不論是否 在發表會場)在看到程式執行的影片時,皆感到十分有趣,認為這個做法、思考方式相當地新穎而不同。但另一方面,由於提出之概念仍位於初期發展階段,許多人 因而對其實用性抱持保留的態度,不斷針對是否能實際應用於業界或者其他用途加以質疑。以下本人針對第二個特性多所著墨,畢竟此作品的優點、趣味之處可於論 文和影片中得知;而與會學者針對系統的限制與發展方向的討論,相較之下相信對於相關領域的未來發展更具意義。

關於此論文所提出之作法的優缺點,我曾取得許多師長同學的意見,而在本次會議報告後,與會學者提出的問題更讓我掌握其限制及需要改進的部份。這些問題包 括:「我認為你做的並不是一個工具,而是一個遊戲。」;「你的系統應該具備的基本元素( building blocks) 究竟有哪些?基本的功能 (functions) 為何?若要使這個工具的功能更全面,你要如何將這些基本的功能涵蓋的範圍拓展開來?如何使行為模式的模型更全面、使得使用者更能隨心所欲地編輯?」;「使 用者能夠編輯既有的行為嗎?還是他們必須將之前編輯好的行為刪除,在整個從頭編輯一個新的?」;「關於行為的呈現方式,這些行為能夠以類似影片片段序列的 方式呈現嗎?又,若線性的影片序列描述方式太過簡單而不適用於生物的行為模式,而採取以樹狀結構去描述行為,那麼系統應該如何將其呈現於使用者眼前?」

在過去,本人便曾被問及類似的問題,但不論透過自己思考或由他人後提出得知,始終沒有尋得正確答案。有一位先生在我的報告結束之後前來討論相關的問題,他 說:「目前這個系統的生物行為的架構(behavioral structure) 太過簡單,無法達成編輯任意的人類行為的目的。」的確,在發展到具有足夠的一般性及強大的功能之前,此系統無法成為一個真正能被廣泛使用的工具。問題的主 因在於(他與我都十分同意這點),要讓使用者以簡單的方式完成複雜的工作,是一件十分困難的事。當系統內的行為架構更為強大、更能描述一般 (general)的情形時,此般行為的架構便很難透過簡單的方式加以描述、編輯。我們更討論出許多相關的其他問題 :「這些行為應該以何種視覺表示方式呈現在螢幕上,才能讓使用者在使用此系統時覺得舒服而不感到害怕?」;「我們應該怎樣做,才能讓使用者保留其控制 權?」卻沒有結論。

這句簡單的話:「如何以容易的方式達成複雜的工作? 」歸納了上述所有的問題,也是End-User-Programming (一般使用者的程式編輯) 領域長久以來企圖解開的謎題。學者們相信這個問題的解答若能越快尋得,人們便可以越快以截然不同的方式使用電腦。由於體認此研究方向的重要性,「在考慮這 個問題時,」我向這位先生強調,「我認為最重要的是界面,或者應該說人與電腦互動的方式,必須堅守『簡單』原則(“Stay Simple!”),而不應依工作內容越趨複雜。」雖然正是因為這樣的原則,使在完成這篇論文之後苦尋不得接下來明確的發展方向,我仍認為這樣的信念正確 無誤。

我對自己願意花時間、不斷探究這個不少人在討論不出結果後便作罷的題目的情形感到驕傲。或許這是當學生的特權︰能夠花費很長的時間探究特定的題目但無所斬 獲,畢竟老師們都有發表、升等的壓力。而我也相信謎團解開的時刻在不久的未來便會來臨。基於對上述問題的此般解讀:「人之所以無法以簡單的方式利用電腦達 成複雜的任務,是因為有許多事情電腦並不了解;若電腦能夠了解許多我們所知道的事情,那麼人和電腦溝通的過程就可以像人與人溝通的過程一樣,省略很多雙方 都已經知道的細節、背景知識」,麻省理工學院的多媒體實驗室(The MIT Media Laboratory)迄今進行了四年的「常識計算」的研究,企圖讓電腦能夠擁有對人們而言那些再理所當然不過的事情—常識。我認為常識計算企圖解決的是 「一般使用者的程式編輯」這個領域中相當大的一個問題,但本次會議中的發問更讓我 意識到許多自己的盲點。編輯的方式、呈現的方法,都需要再進行更深入的探究。

值得一提的是,數位的魚(Digital Fish)這家公司的創辦人(同時也是執行長)丹.赫門先生(Mr. Dan Herman)也在會中和我交換了許多意見。他正在找尋的,和我企圖達成的目標完全一致︰一個簡單、好用、能讓一般使用者也能編輯三維虛擬角色的行為的編 輯工具。遇見他讓我萬分欣喜,因為在我的周遭沒有人就此問題和我有同樣的看法,或認為此類動畫編輯工具如此重要、存在一定程度的需求。他的出現也鼓勵了 我,不需要永遠跟著別人的腳步、去決定什麼才是重要的研究方向,也暗示說不定在未來,我在這個領域真的將有所斬獲。

最後,在這次會議中,我也遇到了在台灣科技大學資訊管理研究所任教的楊傳凱教授,並且也花了不少時間,聊了關於研究、教學、學術生涯等各方面的話題。楊教 授過去也曾是歐陽明教授的學生,近幾年間也常來擔任資訊所的口試委員,對彼此的了解因而使我們的交談能觸及較深入的話題。我很高興能夠認識在組上三位教授 之外的、這位在台灣進行電腦圖學研究的學者,因為雖然背景十分接近,他的想法、思考脈絡和其他我所認識的教授卻相去甚遠。在我們聊到生涯規劃的話題時,他 告訴我過去在美國時指導教授告訴他的、判斷一個人究竟適不適合走學術路線的方法:「那要看你能不能忍受孤獨。」他說在研究生涯的初期,必定有一段孤獨的日 子是研究者必須渡過的。能不能自己一個人工作,對一個人能適應學術研究的生活與否,具有重大的影響。這句話對我來說意義甚鉅,我想也是此行最重要的收穫之 一。

3 Comments:

At 2:27 AM, Anonymous Anonymous said...

Dear ED:

「人之所以無法以簡單的方式利用電腦達 成複雜的任務,是因為有許多事情電腦並不了解;若電腦能夠了解許多我們所知道的事情,
那麼人和電腦溝通的過程就可以像人與人溝通的過程一樣,省略很多雙方 都已經知道的細節、背景知識」

這一句話我在多本不同領域的書都有類似的提問.康德曾提出"先天的判斷如何可能?"
有些哲學方面的說法認為人對世界的感知並非全然是機械式的直觀,而是在感知之前,本身就已經有了先天的觀念,在一些認知心理學的說法也是這樣,那不像是線性的,我覺得是一種網狀甚至是立體的聯結方式,這之中有一個東西就很奇妙,就是所謂"感覺"這一回事,但是光這樣講似乎很抽象.

在符號學中認為"語境"跟語言本身是一體的,語言不能獨立於語境之外,也就是說,理解一個話語,必須同時理解話語所處的時空環境,才能得到正確的理解,比如我們喊"小黃",那可能是我正辦公室叫住一個人,也可能是我在街上招呼計程車

指涉的對象是什麼,要看當時的時空環境.因此在語義學中認為,語言或符號是相對的並且是流動的,因此要綜合的去理解語言及語境,似乎是一個尚待各個領域的研究者回答的問題.

Jason

 
At 7:13 PM, Blogger Brian Yang said...

忍受孤獨的能力

-不只作研究 ,作很多旁人看不懂的事情,都要有這種堅持才是。不管是離開大公司去創業,或是夢想寫出一本嚇死人的好書..
But never forget that you only live once, be true to your inner voice and pursue whatever it leads you to.

 
At 3:44 PM, Blogger Edward Shen 沈育德 said...

To Jason,

"The knowledge representation tradition in computational lexicon design represents words as static encapsulations of purely lexical knowledge. We suggest that this view poses certain limitations on the ability of the lexicon to generate nuance-laden and context-sensitive meanings, because word boundaries are obstructive, and the impact of non-lexical knowledge on meaning is unaccounted for. Hoping to address these problematics, we explore a context-centered approach to lexicon design called a Bubble Lexicon. Inspired by Ross Quillian’s Semantic Memory System, we represent word-concepts as nodes on a symbolic-connectionist network. In a Bubble Lexicon, a word’s meaning is defined by a dynamically grown context-sensitive bubble; thus giving a more natural account of systematic polysemy. Linguistic assembly tasks such as attribute attachment are made context-sensitive, and the incorporation of general world knowledge improves generative capability. Indicative trials over an implementation of the Bubble Lexicon lends support to our hypothesis that unpacking meaning from predefined word structures is a step toward a more natural handling of context in language."(摘自Hugo 的Bubble Lexicon http://web.media.mit.edu/~hugo/research/#bubble_lexicon)
不曉得大師您說的跟這裡呈現的idea有沒有什麼出入?
或許我們真該坐下來好好聊聊, 順便問你看的是哪些書, 該通通買下來帶出國...

To Brian,

It's ironic to me, you know?
I love being in a team and hate working on my own, but meanwhile I am extremely picky about the team to be in. Recently I'm even tired of pushing myself toward someone with achievement, and thinking it may not gonna be bad being a nobody who lives a happy life. What should we do for ourselves anyway?

 

Post a Comment

<< Home