在全球科技创新的浪潮中,人工智能与高新技术领域的合作已成为推动经济转型和社会进步的关键力量。AI能为中国手机厂商的竞争带来哪些改变?
文丨FT中文网编辑 杜若萱
在全球科技创新的浪潮中,人工智能与高新技术领域的合作已成为推动经济转型和社会进步的关键力量。作为创新驱动的核心,产学研合作不仅是学术界与产业界之间的桥梁,更是促进技术进步与人才培养的催化剂。近期,FT中文网采访了香港理工大学的赵汝恒副校长和张磊教授,探讨了如何通过高效的产学研合作推动人工智能等领域的跨越式发展。赵汝恒教授为香港理工大学副校长(研究及创新)和热能及环境工程讲座教授,主管大学在研究与创新、知识转移和创业方面的策划和发展工作。张磊教授长期致力于计算机视觉、图像处理、模式识别等方向的研究,是底层视觉方面的国际权威学者。他同时担任着IEEE Trans. on Image Processing (TIP)的高级编委,IEEE Trans. on Pattern Analysis and Machine Intelligence (TPAMI)、SIAM Journal of Imaging Sciences等多个国际期刊的编委。
以下是采访实录:
FT中文网:能否请您简要介绍一下您的学术背景以及这些年来的主要研究方向?
张磊:我于2006年加入了香港理工大学,至今已经有18年时间。我的学术研究主要集中在“底层视觉”(low-level vision)这一领域,简单来说,就是研究如何通过技术提升图像的清晰度和质量。我们与OPPO的合作起步于2021年,至今已经合作三年,初步成果显著。目前计划将这一联合实验室升级为联合研究中心。通过与产业界的紧密合作,我们的技术不仅仅停留在学术研究层面,更多的是将研究成果转化为能够直接影响消费者生活的实际产品。
FT中文网:能否介绍一下您目前和您的博士生团队正在研究的一些有潜力的项目?这些技术普通消费者能在何时、在哪些领域看到实际应用?
张磊:其实目前许多高校的研究前沿,普通人难以直接感受到,但我认为手机是一个理想的平台,因为几乎每个人都有一台手机,通过手机这样普及率极高的平台,我们能够让更多人感受到前沿技术的变革。我个人的研究主要集中在AI影像领域,但除了影像,手机中的智能助手等功能也有广阔的应用空间。我们整个团队目前的研究方向集中在AI影像技术上,尤其是通过手机平台来展示这些前沿的技术。
举个例子,OPPO最近发布的Find X8手机,就搭载了我们研发的“AI千里长焦”技术,能够在不依赖传统大镜头的情况下,实现远距离拍摄,达到60倍甚至100倍的放大效果,呈现出极为清晰的图像。这是我们与OPPO合作的成果之一,也意味着AI技术在影像领域的广泛应用已经开始进入普通消费者的日常生活。通过这种技术,普通消费者无需依赖昂贵的单反相机,就能轻松拍摄到高质量的远景照片。
FT中文网:手机拍照的放大倍数和清晰度越来越高,消费者可能会认为这是镜头硬件的进步,能否从AI的角度为我们解析一下,具体在这些领域中,AI技术是如何发挥作用的?
张磊:其实,手机摄像头的硬件空间是相当有限的,无法与单反相机的大镜头相比,这也是为什么AI技术在手机影像领域有着巨大的应用潜力。硬件的限制意味着我们需要通过软件和算法的优化来弥补这些不足。AI在这其中的作用,主要体现在图像增强、去噪、对焦等方面。
举个例子,OPPO的“千里长焦”,能让你在拍摄远景时,仍然保持较高的清晰度。传统的长焦镜头如果没有高质量的光学元件,很难做到远距离拍摄时的细节清晰。而通过AI算法,我们可以在图像拍摄后进行后期增强,提升其清晰度和细节表现。比如,当你使用长焦镜头拍摄远处的建筑物时,AI会通过算法识别图像中的噪点并进行去除,使得画面更为清晰。
此外,AI技术还在微距拍摄和运动抓拍方面发挥了重要作用。普通手机拍摄微距物体时,由于距离过近,容易发生对焦不准的情况,而AI可以通过智能识别优化焦距,使得近距离拍摄更为清晰。对于运动中的物体,如小朋友或宠物,AI则能通过实时分析图像中的运动轨迹,帮助用户快速对焦并拍摄到清晰的照片。
FT中文网:中国的国产手机市场是全球竞争最激烈的技术与消费领域之一。近年来,手机厂商在视觉、镜头、硬件、芯片、操作系统等多个方面展开了激烈竞争,从长远来看,AI能为这种竞争带来哪些不同的改变呢?近两年“端侧大模型”概念兴起,很多AI工具已能在手机上进行图像生成或短视频创作,能否根据您的研究经验分享一些有创意的项目?
张磊:AI的发展确实超出了我们的预期,这也是为什么无论是高校还是企业都对AI高度重视。我们的学校最近成立了计算机与数学科学学院,专注于AI研究。今年诺贝尔奖也颁发给了AI相关领域。企业方面,像OPPO提出的“AI手机”也是一个方向。我认为,AI与手机的结合将决定未来手机的发展。如果厂商未能在AI方面取得突破,未来就可能落后。我们现在正在与OPPO合作,聚焦AI影像,未来还计划扩展研究范围。
AI影像方面的确还有很大的可能性。许多AI大模型,如广为人知的文生图模型(如Midjourney)和文生视频模型(如Sora),都在生成式工作方面具有代表性。然而,这些模型在手机上的应用存在很大局限性,因为它们依赖文本描述生成图像或视频。而我们在手机影像领域,更需要的是“图生图”,即根据实际场景生成所需的照片和视频。这种技术的难度更高,要求模型具有更强的可控性和真实性。我们的目标是在未来几年开发专门针对影像生成的大模型,而不仅仅是一般的文生图或文生视频。随着多模态大模型的应用,手机不仅仅能处理图像,还能智能感知环境,做出判断或提醒。为了实现这些,我们需要高校与企业紧密合作。我个人觉得AI包括AIG发展到今天这个年代,学术界跟工业界的联系是比历史上任何时刻更紧密的,科学家能更好地理解实际场景中的复杂问题,而产业界的工程师也能迅速接触到最新的学术思想。这种碰撞将带来许多创新和有趣的成果。
FT中文网:手机作为个人端侧应用的产品,能够迅速将新技术转化为消费者能体验到的生产力。AI视觉在一些高端科技领域,像卫星遥感或显微镜等,仍然有很大的应用空间吗?计算机视觉的研究到应用的链条现在情况如何,未来会有哪些变化?
张磊:目前,AI大模型的主导作用来自自然语言处理(NLP)。尤其是像ChatGPT这样的突破性进展,使得NLP技术引领了AI领域的发展。尽管视觉领域的进展曾比NLP更快,但自从ChatGPT发布后,NLP的技术取得了巨大的成功,并反向影响了计算机视觉领域。如今,很多多模态大模型,例如视觉语言模型VLM(vision language model),核心依然是语言模型,我们将视觉作为一种外语,借助语言模型来适配和整合视觉和语言之间的联系,形成统一框架。目前的多模态模型大多以语言为基础,视觉只是附带元素,现在许多研究者都在努力尝试真正发挥视觉的潜力,创造新的多模态大模型,使其更充分地利用视觉方面的能力。
在尖端科技的应用方面,尽管我们已在视觉领域看到了一些进展,尤其是在大模型的应用上,但目前所谓的大模型,如Sam,Segmeng Anything Model——分割一切模型,实际上还只是针对特定问题的框架,尚未涵盖视觉中的所有问题。虽然这些进展令人兴奋,但距离真正的全面大模型仍有一定距离。相信随着时间推移,全面解决视觉问题的大模型终将出现。
FT中文网:AI视觉与深度伪造(deep fake)技术的广泛应用,也带来了诸如金融诈骗等社会问题。如何从技术角度应对这些问题?
张磊:这实际上是技术博弈的过程,历史上任何时期都会有类似的事情发生。我记得早期,像Google等一些公司举办过全球性的竞赛,目的是让大家试试能否通过更高的精度检测伪造图片等内容,这种技术上的博弈肯定会持续下去,客观来讲促进了技术的进步。但如果纯粹靠技术来解决,它一定不可能彻底解决,政府应加强立法监管,社会、企业和媒体也需共同努力应对这种风险。
FT中文网:您提到理工大学明年要成立新学院,将计算、数据和统计学科融合。我美国一些顶尖大学也在尝试这种跨学科的改革,打破理科和工科的学科界限,形成新的AI学院,您认为这个趋势如何帮助培养顶尖的AI人才?从香港高校的角度看,这种改革与美国或内地的大学相比,有什么优势和劣势?
张磊:不仅欧美,香港和内地许多学校也在做类似的尝试。其实内地很多学校走得更快,已经成立了自己的AI学院。我认为这是必然趋势,因为AI的冲击太大,突破了单一学科的范畴,成为多学科交叉的领域。如果只将AI放在计算机系内,肯定会限制人才的培养。深度学习的迅猛发展得益于数据量和算力的革命,很多以前认为不可能的事情现在变成了现实。计算机学生如果没有足够的物理学和数学基础,只会模仿他人,缺乏创新。香港理工大学将数学与计算机系结合,并新设了数据科学与AI系,未来学生将接受跨学科的课程,培养更广阔的视野。关于香港与欧美、内地的差异,我认为美国在AI人才数量、资源和资本方面仍领先。尽管如此,许多在美国活跃的AI人才是华人。目前这种态势其实是全球化的人才互动性融合,从吸纳人才方面来讲,香港和内地可能提供更好的研究平台。
FT中文网:大湾区的产学研融合,香港政府一直在努力推动,内地、广东、深圳也都支持,整体来说,您如何评价大湾区产学研融合的现状?
张磊:大湾区确实是一个非常有优势的地方,香港、深圳及周边城市都有强大的人才储备。深圳的产业链也非常完整,提供了巨大的机会促进产业转化。无论是香港政府还是内地政府的投入都很大,但我认为仍有一些不足之处。
首先,大家可能有点急功近利。企业和高校的合作大多以项目为基础,企业给高校资金,后者完成一个项目即可。这种方式过于短期化,缺乏深度。即使项目完成了,企业未必能获得所需的成果,教授和学生也往往缺乏足够的时间进行创新。虽然有成功的案例,但我认为这不是最佳的合作模式。
真正有效的合作方式应该是以人才培养为核心。理工大学与OPPO的合作模式便是如此,我们成立了联合创新研究中心,企业的资金支持帮助我们培养博士生和博士后。比如,OPPO投资3000万,计划在5年内培养25名博士生和约10名博士后。通过这种方式,学生不仅接触到学术前沿,还能了解企业实际面临的问题。在假期时,他们会与OPPO的工程师紧密合作,解决实际问题,推动技术创新。这种合作方式的成功体现之一是我们的博士生在今年OPPO Find X8中的AI产品中贡献了核心算法。
FT中文网:您认为这25名博士生毕业后,有多少能留在OPPO,多少能继续从事科研,多少会留在行业里工作?
张磊:首先,我们没有对学生做任何约束,不像一些企业要求签署协议,规定毕业后必须去某个地方工作。OPPO这一点做得很好。我们的博士生从2022年9月入学,到现在已经两年多,尚未毕业,所以很难判断具体有多少人会选择留在OPPO,但我相信一定会有部分博士生留下。很多学生在我们的项目中不仅发表了顶级国际会议论文,而且他们的算法被实际应用到手机中,这对他们来说是非常积极的反馈。我希望有更多的企业能借鉴这样的人才培养方式,眼光和格局放得大一些,而不是只投入一点资金要求解决具体问题。中国的AI发展之所以可能,是因为有了人才的积累。所以,与其追求短期的解决方案来应对小问题,不如从长远考虑,储备人才,为未来的更大成就奠定基础。
FT中文网:香港理工大学在内地的教育网络很广泛,在深圳,惠州,武汉等城市都有自己的研究基地,您怎么看待香港高等教育与内地高校在教学和研究上的合作?能分享一些成功的案例吗?
赵汝恒:香港理工大学一直与内地的许多高校保持合作,涵盖基础研究、共同培养博士生等方面。我们有商学位项目,学生在港理工学习两年后,再到内地名校完成两年的课程,进行联合培养。我们也在各地建设技术创新研究院,目的就是将我们在香港完成的基础研究成果带到内地,利用不同城市的产业链和应用场景进行落地转化。
每个城市的需求不同,内地的产业场景非常丰富,这为我们的研究成果提供了广泛的应用机会。比如在东莞、深圳,我们与OPPO等企业合作,把人工智能技术应用到实际产业中,推动研究生的课题与产业需求紧密结合。这种合作模式使得研究成果能够直接转化为产业应用,提升了影响。
FT中文网:香港理工大学在促进科技创新方面,如何与内地高校或企业进行产学研合作?
赵汝恒:产学研合作并非易事。许多教授主要进行基础研究,特别是在香港,因为空间有限,难以形成完整的产业场景。香港理工大学通常通过与内地高校和企业合作来弥补这一缺口,但要实现有效合作,学校和教授需对目标有清晰共识,教授必须认同将研究落地于产业,而不仅是发表论文。
FT中文网:随着生成式人工智能在教育领域的深入渗透,未来可能会带来哪些教育模式的变革?您如何展望与内地在科研和教育方面的合作,并有何建议?
赵汝恒:生成式人工智能的快速发展已在科研和教育等多个领域产生了深刻影响。现在教师和学生都能通过人工智能工具来支持项目分析、加速信息检索等,从而减少了传统上需要大量时间的资料查找。港理工也在关注生成式AI对教育的潜在影响,并正在评估如何借助这些技术提升教学和科研的影响力。当前我们正在探讨是否应为生成式AI引入相关政策,比如如何保护原创性和知识产权的问题。过去这些问题并不显著,而现在人工智能不仅提供信息,还能产生原创性的创意。我们建议将生成式人工智能视为教育和科研的工具,而非完全替代人类在科研和教学中的核心作用。
FT中文网:最近FT采访了很多香港其他高校的校长和教授,了解到北美华裔学者选择回流香港,尤其在中美学术“脱钩”背景下,这种趋势对香港本地大学有何影响?
赵汝恒:近几年,许多原本在北美的华裔学者选择回流,并且香港在这一过程中扮演了重要的“中转站”角色。作为一个高度国际化的大都市,香港的生活方式和教育系统都与欧美接轨,这使其成为华裔学者更易适应的工作环境。在港理工大学,我们通过政府的支持计划和自身的招聘项目,吸引了许多欧美知名教授来港,近几年讲座教授的人数已从50多名增加到约100名。这其中许多是从海外回来的华裔学者,部分则是非华裔的顶尖人才,他们看中香港的研究环境和生活品质。对许多学者而言,香港提供了了解和融入内地的桥梁,部分学者之所以选择回流香港,也是因为在当前中美关系紧张的背景下,他们的研究,尤其是AI等前沿领域,在北美高校或内地的合作中面临更多限制。而在香港,他们能够继续推进此前的研究,没有此类阻碍。总的来看,这一趋势对我们的高校来说是积极的,不仅增强了科研实力,还与国家对香港的创新人才定位相契合。
FT中文网:近年来,香港高校在内地的合作非常多样,包括分校、联合研发中心、合作基地等形式。您是否考虑将合作范围扩展到大中华区之外?比如,香港在东南亚影响力大,学术和人才交流频繁,是否有可能在东南亚甚至中东建立新的校园或合作办学模式?
赵汝恒:作为负责科研和成果转化的负责人,我们港理工近年来确实在内地建设了不少平台,但下一步我们确实希望“走出去”。东南亚尤其是我们重点考虑的区域。我们目前已与加拿大的滑铁卢大学共建研究中心,主要聚焦于应用物理领域。我们希望将这一合作模式拓展到更多国家。设立分校相对复杂,但研究中心更便于启动。我们也正在与一所知名美国高校洽谈合作,预计很快会公布相关消息。同时,我们积极探讨在印尼、马来西亚、新加坡,以及中东等地建立研究中心的可能性,加强香港高校在国际上的科研合作和学术影响力。