以圖像呈現高維數據
Professor Joe Qin Sizhao
秦泗釗教授

 

香港城市大學(城大)數據科學學院院長兼講座教授秦泗釗教授主講「校長講座系列:學術薈萃」時指出,數據科學工具幫助我們更清楚了解眾多領域的不同維度,包括失業數據、大學排名、城市電力供應、製造業生產等。

秦教授說:「數據分析帶來資訊與知識,可用於預測和推斷因果關係。我們先選定一個問題,然後收集數據,再查找動態特徵。」他也是香港數據科學研究院院長。

秦教授說他選擇「以圖像呈現高維數據」作演講題目,是因為在充滿數據的世界,數據科學視覺化可廣泛應用。本次講座以網上形式進行,並設有限現場觀眾。

他指出,據估計每年約有200萬億條推特,維基百科網有逾5,200萬頁,科睿唯安科學網則有7,900萬篇學術論文。如果沒有視覺化工具,人們對這些數據集的龐大規模,幾乎無法形成明確的概念。

為了說明這個觀點,秦教授播放一段短片,展示新創意在某些歷史時刻匯聚、萌芽和演變的過程。錄像講述一篇開創性論文受學術研究影響的程度,這篇論文是1950年代由英國生物學家克里克與美國分子生物學家沃森發表關於雙螺旋的研究;以及後來的研究從兩位科學家最初發表的論著中獲益之廣。

此外,秦教授解釋了數據科學工具可揭示數據「暗面」(例如新技術開發中的不確定事項)的方法,而非僅是為了突出算法生成數據的積極「白面」。

在結論部分,秦教授指視覺化工具在很多領域均不可或缺,包括商業分析、金融科技、電子商務、社交媒體分析、健康資訊學、工程系統、智慧城市科技等。隨着大數據和數據科學迅速增長,對視覺化工具的需求將與日俱增。