隨機應變
劉雲輝賦予機械人三維視覺
引言:《走進中大》走訪中大七個獲香港政府「產學研1+計劃」撥款項目的主要研究人員,此爲報道系列之六。計劃旨在促進本地大學將科研商品化,每個獲批項目可獲1,000萬港元至一億港元不等的資助。
劉雲輝教授自1995年加入香港中文大學,一直潛心研發機械人及其應用,他開發的智能自動叉車在世界各地物流業界廣泛應用,其初創公司更發展為獨角獸,是中大研究機械人的里程碑。劉教授團隊近年銳意開發三維視覺驅動機械人的創新產品及應用,希望讓機械人有足夠「智慧」不僅在工業環境,並且在環境多變的服務業工作。像人一樣懂得手眼協調、隨機應變。
他說:「機械人本身是沒有眼睛的。你先教它這麼走,它拿了這件東西,再拿回來——它永遠是在重複這個動作,它沒有人的智能。一些工業和服務業場景周圍都有人,環境不是穩定的,而且工作不是一個重複性的作業,會有安全問題。」
團隊今年5月獲政府「產學研1+計劃」項目撥款,旨在開發三維視覺驅動機械人的核心技術和產品,包括實時三維成像傳感器與感知算法,以及支持高頻「眼—腦—運動」協調的通用控制平台,讓機械人在實際工作環境中與人類、其他機械人及物件進行互動。這機械人將可應用於不同領域,包括在建造業中量度預製組件,在汽車製造業裏進行零件和電池的自動測量,和車身檢測。機械人亦可在貨倉或其他場景執行抓取物件的工作。
劉教授的跨學科團隊專家來自機械工程學系及計算機科學與工程學系,包括後者的傅志榮教授和竇琪教授。是次獲得政府「產學研1+計劃」的肯定,團隊計劃將多年鑽研的心血和研究成果大力提升並投產到市場去。
他解釋,目前已面世的三維視覺機械人,視覺反饋緩慢,因此難以安全、快速和具高適應力地進行作業。工業或服務機械人若要執行複習的任務,需以接近人類的高頻率眼—腦—運動協調運作;然而,已面世的產品的頻率只有0.5-2Hz。團隊的目標是開發協調製頻率達至200-1kHz的三維視覺驅動機械人。
「我們主要想把人的智力這部分做得更好。這樣機械人就能夠在物流業或零售商店、超市裏,像貨物分類、抓取,把貨物逐件上架。又例如,現時餐廳裏有機械人送餐,但它只能來回移動,不能再進一步做其他事,仍然缺乏在更動態和複雜環境中工作的多功能性。我希望它未來能夠適應更複雜的任務例如幫忙清理桌子,或在廚房裏做一些簡單的工作,通用性更高一點。」
竇琪教授解釋,傳統的機械人視覺主要是語義的,例如機械人能分辨面前的是一個蘋果、一瓶水。她說:「現在我們還需要準確頻估計物體的位姿,計算物體與機械臂在三維空間中的相對位置,以規劃機械臂的運動,可以從合適的角度抓取任意的目標物體。在六維抓取場景中,機械臂可以從任意角度抓取目標物體,比以前更靈活。」
她說,目前市場上推出的人工智能,是通過把不同語料庫收集整理,放到神經網絡推理模型裏讓電腦學習,它更多是基於語言模型的機器學習技術,很好的完成自然語言處理。
「但這種人工智能,領域內普遍認爲對物理世界的理解是非常有限的。例如,當我們需要用機械人去做抓取物體,抓取後機械人要把它放到哪裏去?我們需要對真實世界有充分理解,我們需要去貨倉、服務的實際場景採集數據,以建立和適配用於機械人的大模型。」
談到是次準備申請的工夫,劉教授說,一切都是沿自團隊各人多年來的努力。劉教授鑽研工業機械人和機械人視覺長達三十年。竇教授一直致力開發電腦演算法,在研究機械人視覺方面也累積了相當多的經驗。
他說:「首先你要長時間積累很多經驗和知識,然後就是找合適的應用方法。第三,我覺得更重要是發展一個所謂deep tech(深科技),你的技術要有競爭力和新穎的。最後就是要找業界參與。」
項目團隊將與業界夥伴緊密合作,推動三維視覺驅動機器人在不同領域實現商業化,例如華潤集團和五菱汽車,都能提供不同的服務業、工業和建造業場景與團隊探討等。
文:吳卓盈
攝:D. Lee