播放视频

贾佳亚分享获颁「香港创新企业家年度大奖」的感受,并探讨制造业的新趋势(来源:香港工业总会)

卓尔非凡

创科企业家贾佳亚乘风启航

不是每个人都勇于另辟蹊径,中大著名计算视觉和人工智能专家贾佳亚教授早于学生时代已一头栽进充满未知的研究范畴。他说:「20年前,人工智能(AI)声名不佳,因为它的智慧水平很低。」然而,贾教授潜心研究AI的高瞻远瞩和坚毅,为他的人生履历锦上添花,包括创立一家科技独角兽公司,以及获颁「香港创新企业家年度大奖」。

贾教授乘着全球工业4.0的技术浪潮,2019年创立专注于智能制造业的思谋集团有限公司(SmartMore),透过自动持续优化提高生产效率与质量。凭借20多年的研究经验,他带领团队打造了扩展快、应用层面广泛的智能平台。SmartMore体现了中大锐意推行研究商业化,肩负发展城市创科生态系统的重任。

燃点智能制造业之星火

贾教授指出,新一代的「智能机器」开始取代德国、日本、美国和中国大陆工厂中低端的「传统机器」,可以在无人工作间全天候24/7暗中运行,智能机器的传感器相当于人的眼睛、耳朵和鼻子,甚至拥有AI的「大脑」来监控生产线,发现缺陷时会实时做决策。与传统工厂相比,这是一个重大进步,因为在传统工厂中,「不懂思考」的机器只会无意识地重复机械动作。

SmartMore专注于智能制造业,透过自动持续优化提高生产效率与质量(受访者提供)

SmartMore在短短18个月内,由一家初创企业变身为市值10亿美元的独角兽。公司现时在全球有过千名员工,逾七成员工拥有硕士或博士学位,研发人员及研发开支占比皆超过六成,服务逾100家行头企业,包括空中客车、卡尔蔡司和多家《财富》世界 500 强公司。

AI涉及高端技术,研发开支非常昂贵。现时谷歌、OpenAI和微软等科技巨头已花费数十亿美元开发「通用人工智能」(英文缩写为AGI),ChatGPT是其中一例。电话面世75 年后才达到一亿用户,WhatsApp 则用了三年半,而ChatGPT 在短短两个月内已达到了这个规模。

贾教授解释说:「AGI必须精通不同范畴的知识,所以研发开支非常昂贵。SmartMore之所以发展迅速,在于我们针对制造业用户的痛点提供专门的人工智能解决方案。」

为表扬贾教授对推动智能制造和数码创新的热忱,香港工业总会(工总)于今年2月中旬向他颁授首届「香港创新企业家年度大奖」。 他说:「我很荣幸获得这个奖项。SmartMore承诺推动智能制造和支持香港的再工业化计划,从而创造更多就业机会,并改善创科生态系统。」

创新科技及工业局局长孙东教授在首届「香港创新企业家奖」颁奖典礼向贾教授颁发「创新企业家年度大奖」(数据源:工总)

一个改变生命的决定

贾教授坦言,他在25多年前离开家乡到复旦大学学习时,几乎不知道甚么是计算。他说:「但我意识到我们已经进入了使用计算机的新时代,所以选择修读计算科学。」如今,他是中大计算科学与工程系的终身教授。

他是国际电气和电子工程师学会(IEEE)的院士,论文被引用超过50,000次。他是AI研究的重点期刊《IEEE模式分析与机器智能汇刊》的副主编,曾在微软亚洲研究院、Adobe公司和腾讯担当重要的职务。

他本来可以选择研究网络、数据库设计和算法等范畴。他表示:「但我喜欢看漂亮的图片、照片、影像——视觉内容不仅仅是一堆数据或数值,而是我可以直接感知的东西。 我对自己说,如果我想直接看到图像结果,为什么不选择图像处理或计算视觉呢?」

从科幻到现实

计算视觉现已在是AI模拟人类感知的一部分,举例说,计算机可以区分猫和狗的图像。但贾教授坦言,20年前的AI并不精密,甚至难以完成最简单的任务,例如识别印刷纸上的字母或字符。

2012年以前,连接成百上千个计算机「神经元」(就像人脑中的突触)的算法大多会产生乱码。然而,当加拿大科学家开始将算法应用于数百万个神经元时,他们开辟了AI的新天地,输出的结果变得有秩序而且有意义。计算机终于能够解读图像,可以找出猫与狗的区别。

他笑着说:「从那时起,我们终于被称为『AI研究人员』,因为计算视觉不再是科幻的。我们感到它会变得强大、有用,适用于许多领域。」贾教授和他的博士生自此开始了另一个十年的艰苦奋斗,其中一个重点是研究如何引入计算机「神经元」,并结合包括自然语言、图像、录像和声音在内的多模态信息。他其中一位博士毕业生徐立现在担任全球其中一家最大的AI公司商汤科技的行政总裁。

领先群雄

AI研究是一场激烈的时间竞赛。贾教授观察到技术不断推陈出新,说道:「每个算法只能用半年左右。不仅仅是计算工程正在快速演变,AI的智慧水平也越来越高,如果我们要与时并进,就必须密切关注这个研究范畴的新趋势。」

他联同其顶尖门生密切关注研究领域的趋势。「这些研究相当密集,意味着很多人同时研究同一个课题。一个以往需时50年的研究课题,现在可以在半年内解决——然后我的博士就要另觅一个新课题来研究。」

目前贾教授门下的博士生多达40人,他们从教授20多年的研究资历中获益甚丰,有助于看清科研发展的蓝图。「我提醒他们,在计算工程研究的圈子中,有哪些课题是最重要的,这样他们就不会浪费宝贵的时间在晦涩难懂的问题上。」

深度视觉实验室是贾教授设立的一个非正式团体,旨在汇聚香港以至海外等顶尖大学的计算工程友好,共同探究关键论文和研究领域的最新进展,找出未来五到十年最需要解决的课题。

深度视觉实验室让中大及其他计算机科学家通力合作,共同找出下一个重要的研究议题(受访者提供)

静水流深

贾教授正在解决其中一个最棘手的问题:如何衔接计算视觉和自然语言处理(英文缩写为NLP)。「本质上,语言和视觉内容处理属于不同的研究领域,但它们正在融合,因为计算视觉研究人员正在寻找NLP模型来处理视觉数据,也曾有一段时间,NLP 研究人员使用计算视觉解决方案。」

若然取得研究成果,用户有望通过与计算机自然交谈来制作海报,而不是输入关键词来找海报素材,这当然知易行难。贾教授说:「解读视觉和语言编码信息的方式截然不同,衔接两者无疑是我当前最重要的任务之一。在不久的将来,我们将悉力在系统层面研发出最好的解决方案,这个过程涉及数十亿个训练参数。

「我不怕困难,因为困难是创新过程的一部分。智慧技术能改善人的生活。希望我的榜样能够激励更多年轻人去探索新领域,创造社会价值。」

By Jenny Lau

分享文章:

欢迎大学同仁向《走进中大》投稿,请提交至 enews_reply@cuhk.edu.hk 。「快讯新知」的英文字数上限为500字,中文为700字。提交前,请先参考《走进中大》文章的内容及格式。

若提交内容获采纳发表,我们将联络投稿人。请注意《走进中大》保留决定是否发表内容及对内容作编辑的权利。

截稿日期详看这里