賈佳亞分享獲頒「香港創新企業家年度大獎」的感受,並探討製造業的新趨勢(來源:香港工業總會)
卓爾非凡
創科企業家賈佳亞乘風啟航
不是每個人都勇於另闢蹊徑,中大著名計算機視覺和人工智慧專家賈佳亞教授早于學生時代已一頭栽進充滿未知的研究範疇。他說:「20年前,人工智慧(AI)聲名不佳,因為它的智慧水準很低。」然而,賈教授潛心研究AI的高瞻遠矚和堅毅,為他的人生履歷錦上添花,包括創立一家科技獨角獸公司,以及獲頒「香港創新企業家年度大獎」。
賈教授乘著全球工業4.0的技術浪潮,2019年創立專注于智慧製造業的思謀集團有限公司(SmartMore),透過自動持續優化提高生產效率與品質。憑藉20多年的研究經驗,他帶領團隊打造了擴展快、應用層面廣泛的智慧平臺。SmartMore體現了中大銳意推行研究商業化,肩負發展城市創科生態系統的重任。
燃點智能製造業之星火
賈教授指出,新一代的「智慧型機器」開始取代德國、日本、美國和中國大陸工廠中低端的「傳統機器」,可以在無人工作間全天候24/7暗中運行,智慧型機器的感測器相當於人的眼睛、耳朵和鼻子,甚至擁有AI的「大腦」來監控生產線,發現缺陷時會即時做決策。與傳統工廠相比,這是一個重大進步,因為在傳統工廠中,「不懂思考」的機器只會無意識地重複機械動作。
SmartMore在短短18個月內,由一家初創企業變身為市值10億美元的獨角獸。公司現時在全球有過千名員工,逾七成員工擁有碩士或博士學位,研發人員及研發開支占比皆超過六成,服務逾100家行頭企業,包括空中客車、卡爾蔡司和多家《財富》世界 500 強公司。
AI涉及高端技術,研發開支非常昂貴。現時穀歌、OpenAI和微軟等科技巨頭已花費數十億美元開發「通用人工智慧」(英文縮寫為AGI),ChatGPT是其中一例。電話面世75 年後才達到一億用戶,WhatsApp 則用了三年半,而ChatGPT 在短短兩個月內已達到了這個規模。
賈教授解釋說:「AGI必須精通不同範疇的知識,所以研發開支非常昂貴。SmartMore之所以發展迅速,在於我們針對製造業用戶的痛點提供專門的人工智慧解決方案。」
為表揚賈教授對推動智慧製造和數碼創新的熱忱,香港工業總會(工總)於今年2月中旬向他頒授首屆「香港創新企業家年度大獎」。 他說:「我很榮幸獲得這個獎項。SmartMore承諾推動智慧製造和支援香港的再工業化計畫,從而創造更多就業機會,並改善創科生態系統。」
一個改變生命的決定
賈教授坦言,他在25多年前離開家鄉到復旦大學學習時,幾乎不知道甚麼是計算機。他說:「但我意識到我們已經進入了使用電腦的新時代,所以選擇修讀計算機科學。」如今,他是中大計算機科學與工程系的終身教授。
他是國際電氣和電子工程師學會(IEEE)的院士,論文被引用超過50,000次。他是AI研究的重點期刊《IEEE模式分析與機器智慧彙刊》的副主編,曾在微軟亞洲研究院、Adobe公司和騰訊擔當重要的職務。
他本來可以選擇研究網路、資料庫設計和演算法等範疇。他表示:「但我喜歡看漂亮的圖片、照片、影像——視覺內容不僅僅是一堆資料或數值,而是我可以直接感知的東西。 我對自己說,如果我想直接看到圖像結果,為什麼不選擇影像處理或計算機視覺呢?」
從科幻到現實
計算機視覺現已在是AI模擬人類感知的一部分,舉例說,電腦可以區分貓和狗的圖像。但賈教授坦言,20年前的AI並不精密,甚至難以完成最簡單的任務,例如識別印刷紙上的字母或字元。
2012年以前,連接成百上千個電腦「神經元」(就像人腦中的突觸)的演算法大多會產生亂碼。然而,當加拿大科學家開始將演算法應用于數百萬個神經元時,他們開闢了AI的新天地,輸出的結果變得有秩序而且有意義。電腦終於能夠解讀圖像,可以找出貓與狗的區別。
他笑著說:「從那時起,我們終於被稱為『AI研究人員』,因為計算機視覺不再是科幻的。我們感到它會變得強大、有用,適用於許多領域。」賈教授和他的博士生自此開始了另一個十年的艱苦奮鬥,其中一個重點是研究如何引入電腦「神經元」,並結合包括自然語言、圖像、錄影和聲音在內的多模態資訊。他其中一位博士畢業生徐立現在擔任全球其中一家最大的AI公司商湯科技的行政總裁。
領先群雄
AI研究是一場激烈的時間競賽。賈教授觀察到技術不斷推陳出新,說道:「每個演算法只能用半年左右。不僅僅是計算機工程正在快速演變,AI的智慧水準也越來越高,如果我們要與時並進,就必須密切關注這個研究範疇的新趨勢。」
他聯同其頂尖門生密切關注研究領域的趨勢。「這些研究相當密集,意味著很多人同時研究同一個課題。一個以往需時50年的研究課題,現在可以在半年內解決——然後我的博士就要另覓一個新課題來研究。」
目前賈教授門下的博士生多達40人,他們從教授20多年的研究資歷中獲益甚豐,有助於看清科研發展的藍圖。「我提醒他們,在計算機工程研究的圈子中,有哪些課題是最重要的,這樣他們就不會浪費寶貴的時間在晦澀難懂的問題上。」
深度視覺實驗室是賈教授設立的一個非正式團體,旨在彙聚香港以至海外等頂尖大學的計算機工程友好,共同探究關鍵論文和研究領域的最新進展,找出未來五到十年最需要解決的課題。
靜水流深
賈教授正在解決其中一個最棘手的問題:如何銜接計算機視覺和自然語言處理(英文縮寫為NLP)。「本質上,語言和視覺內容處理屬於不同的研究領域,但它們正在融合,因為計算機視覺研究人員正在尋找NLP模型來處理視覺資料,也曾有一段時間,NLP 研究人員使用計算機視覺解決方案。」
若然取得研究成果,使用者有望通過與電腦自然交談來製作海報,而不是輸入關鍵字來找海報素材,這當然知易行難。賈教授說:「解讀視覺和語言編碼資訊的方式截然不同,銜接兩者無疑是我當前最重要的任務之一。在不久的將來,我們將悉力在系統層面研發出最好的解決方案,這個過程涉及數十億個訓練參數。
「我不怕困難,因為困難是創新過程的一部分。智慧技術能改善人的生活。希望我的榜樣能夠激勵更多年輕人去探索新領域,創造社會價值。」
By Jenny Lau