3月30日,来自学界、产业界、投资界投身AI领域的科大校友们在位于阿尔法公社的科大硅谷北京创新中心齐聚一堂,科大校友创业投资论坛AIGC应用研讨拉开帷幕。
与以往学界大咖聚集的科大校友活动不同,参加讨论的,全部是来自产业第一线的直接参与者。
14点钟,主持人阿尔法公社创始人许四清宣布论坛开始。本次论坛也在全球进行同步直播,全网在线人数最高达12万人。
本场论坛一开场便是焦点环节。加拿大工程院外籍院士、IEEE Fellow、Hidream.ai创始人梅涛与智能计算科技领军人物、IEEE TCMC Rising Star、Hidream.ai CTO姚霆两位科技界的领袖对火爆全球的Sora视频制作应用技术细节及其商业前景进行了深入探讨。
“
今年标志着多模态和AI应用元年的到来
”
,梅涛院士开场时如是说,并通过展示Sora的效果及其面临的挑战,引入了一系列精彩的问答。姚霆博士随后阐释了Sora与其他视频生成应用的技术差异:“Sora的核心技术优势在于其生成能力,能够省去在庞大数据集中寻找文本匹配的步骤。这意味着在用户进行推理操作时,大模型的生成和改写过程无缝衔接,理解更为深入。”
两位校友共同介绍了Sora在训练和推理方面的基本框架、训练的关键技术和推理的独特之处。特别指出,
Sora在生成长篇幅内容方面具有显著优势,
并讨论了其是否能成为一个全球性的模型。姚霆博士提到,“虽然Sora能够学习物理现象,但目前还未能完全建模物理规律。”然而,梅涛院士对此持乐观态度,相信这是一个可克服的难题。
在商业化方面,Sora尚存在一些挑战,其商业应用路径尚未完全清晰。
梅涛院士指出,“从商业化角度看,Sora的成本仍然较高,推理效率需进一步优化,同时交互体验亦需加强。”
两位校友还现场分享了Hidream.ai在产品规划、视频案例展示以及Video DiT架构进展方面的最新成果。他们介绍说,Hidream.ai的差异化功能已经上线并取得了初步成效,实现了“多镜头故事叙述+主题一致性+可控制性/超高清晰度”的目标,预计上半年能够实现商业化应用。
现场辩论:AIGC能否让所有主播成为董宇辉和陈晓薇?
论坛的第二部分直接进入了激烈的辩论环节,辩论发起人窦剑文主持,四位校友分为正、反两方:针对AIGC是否能让每一位主播成为顶级主播,上演一场唇枪舌战,掀起了思想风暴。
从左往右:人本智汇创始人李亚(8710校友)、海默科技创始人窦剑文(8504校友)、晓薇博士视频号创始人陈晓薇(83少校友)、诺亦腾联合创始人&CTO戴若犁(9705校友)
戴若犁一开场直切主题,“在AI的辅助下,我们究竟是在缩小能力差距,还是仅仅在扩大已有的鸿沟?”他强调AIGC在实际应用中并没有实现所谓的平权效果,而是可能加大了能力差异:
“它对低能力者帮助大还是对高能力者帮助大?”
窦剑文频频犀利回辩,以计算器比喻回应戴若犁的质疑,认为AI技术本质上是一种能力平权的工具:
“你的算盘打得不好,他的算盘打得好,但你们有计算器,计算能力是平权的。”
戴若犁再次提出AIGC当前的局限性,并举例说明技能不是直播红不红的唯一因素:“一个主播红与不红,技能方面不是核心的能力。”
窦剑文从内容创作的角度反驳,强调内容的质量是关键,而内容本身也是AIGC可以完成的:“陈晓薇、董宇辉都不是靠个人的表现力和颜值,而是有趣、有料、有价值的内容打动和吸引了观众。”
陈晓薇紧紧抓住辩论脉络,对AIGC能否达到预期效果表示怀疑,“我们要问的真正的问题是,它能不能让陈晓薇的文案像董宇辉的一样更吸引眼球?”她强调AI在内容创作方面的局限性,
“一切离开数字讨论问题和定义质量都是耍流氓。吸引不了流量的内容就没有质量吗?”
指出了衡量AI成果的难点。
李亚则表达了对AIGC未来平权潜力的乐观看法,肯定AIGC能够培养出超级个体的同时,更认可它不远的将来实现普及的可能:
“AI的普及确实是时间问题,但这个时间将是按照月来计算的,相信GPT4.5或5发布后会带来一次新的震动。”
正方二位更看好AIGC未来的发展前景,而反方从实用性和成本效益角度对AIGC的短期内实现提出质疑。整个辩论环节,不仅展现了参与者们对AIGC应用现状与未来潜力的深入理解,也体现了科技界对这一领域发展的不同预期和观点。
学界与产业界的对话:AIGC应用的黄金十年何时到来?
进入2024年,OpenAI的Sora视频模型成为了业界的焦点。这些刷屏应用真的将我们带到AIGC的黄金时代了吗?学者和企业家校友们就此在技术发展、市场需求、跨领域合作等多个方面展开热议。