城大研發GenAI平台 助科研論文專利分析 促進科研知識共享 設數據安全私隱保障
「科技創新服務」涉及研究項目的管理、研究成果的推廣與技術轉移等範疇,但往往因不同資訊系統的數據難以共享,而遇到科研資訊「碎片化」的挑戰。香港城市大學(城大)的科研團隊全力開發生成式人工智能(GenAI)技術,建立「科創GPT」,通過創建科研知識圖譜,勾勒出科研項目、論文、專利等之間的關係,並在數據安全及私隱保障前設下,以助成立不同領域的知識庫,促進知識共享。項目最近更獲政府「產學研1+計劃」撥款資助。
為解決「資訊孤島」(information silos)的問題,自2007年起,城大資訊系統學系馬建教授及團隊致力開發並不斷改良「科研之友」(ScholarMate.com)平台,使它成為中國最專業的協同創新網絡平台,成功連繫政府資助機構、大學、科研機構及科創公司,促進合作與知識共享,實現科研成果(如學術論文與專利)共用。科研之友迄今有超過800萬名註冊用戶,收錄達7,800萬項研究成果。
憑藉科研之友的經驗,馬教授的團隊以此為基礎,現正開發新一代的「聯邦學習技術」(Federated Learning Technology),結合了科研知識圖譜(knowledge graphs)與大型語言模型(Large Language models,LLMs),同時以去中心化模式,促進創新網絡平台上的用戶,共同訓練及微調上述圖譜及模型,著力推動及實現科技創新服務的數碼化轉型,從而釋放生成式人工智能的力量。
此項目近日獲得了香港特區政府創新科技署推出的「產學研1+計劃」資助。
圖譜勾勒科研項目關係 提供人工智能助理
項目旨在創建一個具有生成式人工智能能力的智慧協同創新網絡平台,保障數據安全、私隱,並具有運營效率。新平台將專注於創立及構建內容全面的科研知識圖譜,即以圖譜方式,勾勒出全球各間大學、研究機構和科技公司內部的研究人員、科研項目、研究論文和專利等之間的關係。按照國家研究學科的標準和相關新興產業來組織數據,目標是利用科研知識圖譜,生成針對特定領域的全面知識庫。
通過充分利用協同創新網絡平台的大量研究論文和專利,城大科研團隊將進一步訓練和微調一個基於大型語言模型的專業領域「科創GPT」,即STIGPT(Science, Technology and Innovation GPT)。這個生成式人工智能模型能夠利用語意搜索、智能推薦和度身訂造的個人化內容生成,為研究機構和科研人員,提供可促進知識共創的人工智能助理服務。
同時,團隊將開發「聯邦學習技術」,以去中心化的訓練方法,促進平台上的用戶,共同訓練及微調科研知識圖譜和大型語言模型。這項技術能在提高大語言模型的準確性和適應性的同時,確保數據安全和保障個人隱私,並通過科創GPT大模型,為用戶提供個人化及適用於其特定領域的科技創新服務。
開發低代碼智能系統 減程式編寫難度
再者,城大研究團隊亦將開發一個「低代碼智能系統開發平台」,可以簡化及降低程式編寫的難度,令機構用家能夠以最少的編程工作量,制定及實現數碼轉型解決方案,從而顯著降低使用門檻,大幅提升營運效率。
研究團隊預期,通過整合科創GPT與科研之友,可以打造出全球首個具有生成式人工智能的智慧協同創新網絡平台,以連繫各間大學和企業的研究人員,共同創造知識產權。這項研發成果也可以推動、加速各種科技創新服務的數碼化轉型,包括智慧科研管理、學術會議出版服務、研究成果推廣,以及技術轉移服務等。這些轉型將帶來更高效率的決策過程、更簡化的流程,並可以加強政產學研之間的合作。
事實上,科技創新服務的市場潛力極為巨大,尤其是中國在科研和技術發展領域的投資非常可觀。在城大的創新創業旗艦計劃HK Tech 300的支持之下,馬教授的科研團隊已成立了初創「創新城技術服務有限公司」(InnoCity.com),藉此把研究成果商品化,尤其專注於生成式人工智能在技術轉移中的應用,以開拓當中充滿潛力及前景的市場機遇。
「通過在協同創新網絡平台上充分運用生成式人工智能技術,這研究項目將可加速研究與創新的步伐。」馬教授總結上述新項目可能帶來的技術突破。他補充,項目可促進產學研用戶的知識共創,從而提升科技創新服務的質量和效率,「這與政府有意把香港定位為國際創新科技樞紐的政策相一致。」