随机应变

刘云辉赋予机械人三维视觉

引言:《走进中大》走访中大七个获香港政府「产学研1+计划」拨款项目的主要研究人员,此为报道系列之六。计划旨在促进本地大学将科研商品化,每个获批项目可获1,000万港元至一亿港元不等的资助。

刘云辉教授自1995年加入香港中文大学,一直潜心研发机械人及其应用,他开发的智能自动叉车在世界各地物流业界广泛应用,其初创公司更发展为独角兽,是中大研究机械人的里程碑。刘教授团队近年锐意开发三维视觉驱动机械人的创新产品及应用,希望让机械人有足够「智慧」不仅在工业环境,并且在环境多变的服务业工作。像人一样懂得手眼协调、随机应变。

他说:「机械人本身是没有眼睛的。你先教它这么走,它拿了这件东西,再拿回来——它永远是在重复这个动作,它没有人的智能。一些工业和服务业场景周围都有人,环境不是稳定的,而且工作不是一个重复性的作业,会有安全问题。」

团队今年5月获政府「产学研1+计划」项目拨款,旨在开发三维视觉驱动机械人的核心技术和产品,包括实时三维成像传感器与感知算法,以及支持高频「眼—脑—运动」协调的通用控制平台,让机械人在实际工作环境中与人类、其他机械人及物件进行互动。这机械人将可应用于不同领域,包括在建造业中量度预制组件,在汽车制造业里进行零件和电池的自动测量,和车身检测。机械人亦可在货仓或其他场景执行抓取物件的工作。

三维视觉机械人的组成和广泛用途

刘教授的跨学科团队专家来自机械工程学系及计算机科学与工程学系,包括后者的傅志荣教授和窦琪教授。是次获得政府「产学研1+计划」的肯定,团队计划将多年钻研的心血和研究成果大力提升并投产到市场去。

他解释,目前已面世的三维视觉机械人,视觉反馈缓慢,因此难以安全、快速和具高适应力地进行作业。工业或服务机械人若要执行复习的任务,需以接近人类的高频率眼—脑—运动协调运作;然而,已面世的产品的频率只有0.5-2Hz。团队的目标是开发协调制频率达至200-1kHz的三维视觉驱动机械人。

三维视觉机械人的组件 

「我们主要想把人的智力这部分做得更好。这样机械人就能够在物流业或零售商店、超市里,像货物分类、抓取,把货物逐件上架。又例如,现时餐厅里有机械人送餐,但它只能来回移动,不能再进一步做其他事,仍然缺乏在更动态和复杂环境中工作的多功能性。我希望它未来能够适应更复杂的任务例如帮忙清理桌子,或在厨房里做一些简单的工作,通用性更高一点。」

窦琪教授解释,传统的机械人视觉主要是语义的,例如机械人能分辨面前的是一个苹果、一瓶水。她说:「现在我们还需要准确频估计物体的位姿,计算物体与机械臂在三维空间中的相对位置,以规划机械臂的运动,可以从合适的角度抓取任意的目标物体。在六维抓取场景中,机械臂可以从任意角度抓取目标物体,比以前更灵活。」

刘教授与窦琪教授展示智能机械人拣选站

她说,目前市场上推出的人工智能,是通过把不同语料库收集整理,放到神经网络推理模型里让电脑学习,它更多是基于语言模型的机器学习技术,很好的完成自然语言处理。

「但这种人工智能,领域内普遍认为对物理世界的理解是非常有限的。例如,当我们需要用机械人去做抓取物体,抓取后机械人要把它放到哪里去?我们需要对真实世界有充分理解,我们需要去货仓、服务的实际场景采集数据,以建立和适配用于机械人的大模型。」

智能机器人拣选站在仓库执行任务

谈到是次准备申请的工夫,刘教授说,一切都是沿自团队各人多年来的努力。刘教授钻研工业机械人和机械人视觉长达三十年。窦教授一直致力开发电脑演算法,在研究机械人视觉方面也累积了相当多的经验。

他说:「首先你要长时间积累很多经验和知识,然后就是找合适的应用方法。第三,我觉得更重要是发展一个所谓deep tech(深科技),你的技术要有竞争力和新颖的。最后就是要找业界参与。」

项目团队将与业界伙伴紧密合作,推动三维视觉驱动机器人在不同领域实现商业化,例如华润集团和五菱汽车,都能提供不同的服务业、工业和建造业场景与团队探讨等。

文:吴卓盈
摄:D. Lee

分享文章:

欢迎大学同仁向《走进中大》投稿,请提交至 enews_reply@cuhk.edu.hk 。「快讯新知」的英文字数上限为500字,中文为700字。提交前,请先参考《走进中大》文章的内容及格式。

若提交内容获采纳发表,我们将联络投稿人。请注意《走进中大》保留决定是否发表内容及对内容作编辑的权利。

截稿日期详看这里