专栏名称: 数字时氪
36氪旗下官方账号。记录中国产业故事,推动全球数智发展。
目录
相关文章推荐
51好读  ›  专栏  ›  数字时氪

Transformer原作者和OpenAI前核心成员加持,这家全球化人工智能公司宣布完成首轮融资|年度AI对话

数字时氪  · 公众号  ·  · 2023-07-13 12:04

正文

请到「今天看啥」查看全文


即便大模型和通用人工智能领域入局者众多,reInventAI的创始团队依然颇为闪耀。


| 真梓

通用大模型席卷全球的热度还在持续,就在今天,又有一家人工智能公司宣布完成融资。

36氪独家获悉,专注基础模型和通用人工智能(AGI)的全球化人工智能公司reInventAI于今日宣布完成由联想创投独家投资的数千万美元首轮融资。

作为一家目标指向AGI的全球化人工智能公司,reInventAI成立于2023年5月,在德国柏林和中国上海同时运营,其德国公司名为nyonic。不久前曾有外媒介绍,公司已经开始训练其第一个大规模的语言模型,预计在2024年年初发布。

即便大模型和通用人工智能领域入局者众多,reInventAI的创始团队依然颇为闪耀。 据介绍,reInventAI的阵容包括欧洲科学院院士、OpenAI GPT核心成员、原SAP全球高级副总裁兼全球AI负责人等。以及,Transformer原作者也会为公司提供建议。

reInventAI的联合创始人兼首席科学家Hans Uszkoreit教授是德国著名人工智能科学家和自然语言处理(NLP)专家,2002年即当选为欧洲科学院院士。 他带领的博士生创办了谷歌翻译。同时,Hans还曾作为企业家创办多家人工智能企业。

Hans的儿子Jakob Uszkoreit 可能是全球大语言模型领域最重要的学者和工程师之一——他是论文 《Attention is all you need》 即Transformer模型的核心作者 也是前Google Brain柏林团队负责人、前Google Brain机器翻译团队负责人。从Google离开后,他创办了Inceptive,这次也将对reInventAI提供建议。不久前,德国法兰克福汇报(FAZ)报道,在Jakob 推出Transformer模型架构时,Hans也提供了许多重要建议。

另外,前SAP全球高级副总裁及全球人工智能部门负责人徐飞玉博士已于7月初正式加入reInventAI,担任首席创新官。她具有20年以上的NLP、机器翻译和对话系统研究经验。在 SAP 负责全球 AI战略,大模型战略,同时也帮助众多 SAP 的大型企业客户设计创新和推动大语言模型在具体行业中的应用。她同时还是采埃孚ZF全球监事会成员,和德国人工智能研究中心(DFKI)监事会成员。

曾于OpenAI任职的 Johannes Otterbach博士,担任公司的首席技术官(CTO)。 reInventAI介绍,Johannes曾作为OpenAI GPT创始团队成员,担任算法和数据工程团队的负责人,全程参与GPT-2及GPT-3的研发和工程。公司表示,Johannes “是全球少数几位掌握GPT-3这种革命性模型训练奥秘的专家”。在加入OpenAI之前,Johannes是Palantir Technologies负责数据和Infra的核心工程师,并在哈佛大学进行量子物理和量子计算机的研究。

就业务目标而言,reInventAI意在打造领先的SOTA(state-of-the-art)基础模型,还将为行业开发可信赖、高性能的垂直模型。 也就是说,对于部分行业,公司不仅会提供可直接使用的预训练行业基础模型,还支持企业客户根据自身需求进一步定制专属基础模型。

公司表示,由于reInventAI与欧洲渊源深厚,团队拥有涵盖欧洲语言和行业的专业数据集知识,以及在多语言领域的长期积累,其模型也将在多语言和体现多文化价值观这两个方面具备卓越能力。基于这些特点,将来reInventAI开发的适用于欧洲市场的多语言基础模型和训练此模型的能力将可以适用于其他多语言市场。

在本轮融资完成前不久,36氪与reInventAI的联合创始人兼首席科学家Hans Uszkoreit教授在WAIC世界人工智能大会进行了交流。

在交流中,他对AGI、人工智能技术的趋势,以及国际AI生态提出了自己的观点,以下为内容节选,供读者参考:

36氪:过去半年,不少人都在讨论AGI。很好奇在你的定义中,AGI是怎样的?应该具备哪些特点和能力?

Hans: 我将AGI(通用人工智能)定义为一种具备更高认知能力的人工智能系统,可以在广泛的认知任务中表现出与人类相当或更高的能力。与专为特定任务设计的狭义人工智能系统不同,AGI的目标是拥有对世界的全面理解,并能够将这些知识应用于不同的问题解决场景。

具体拆分,AGI的特征和能力可以总结为以下几点:

泛化: AGI能将在一个领域中学到的知识和技能转移到新的和不熟悉的情境中,表现出高度的适应性和概括能力。

学习和自我完善: AGI具备从经验中学习并持续改进性能的能力。它可以独立获取新知识,完善现有模型,并自主发展新策略。

推理和解决问题: AGI具备高级推理和问题解决能力,包括逻辑推理、批判性思维、规划和决策制定。它可以处理复杂情境,评估多个选项,并生成创造性解决方案。

语境理解: AGI具有对它所处的环境的深刻理解,包括语言理解、常识推理以及对社会文化细微差别的认识。

交流和互动: AGI可以通过自然语言接口与人类和其他智能系统有效地进行交流。它可以理解和生成类似于人类的回应,进行有意义的对话,并解释和回应非语言暗示。

自主学习和适应: AGI具有自主学习和适应能力,能够独立获取新技能和知识。它可以根据不断变化的环境或新数据主动寻找信息并更新其模型。

道德和价值一致性: AGI具有道德推理能力,行为符合人类价值观和社会规范。它在决策过程中尊重隐私、公平和其他道德因素。

需要注意的是,目前AGI仍是一个假设的概念,实现真正的AGI仍是一项持续的研究挑战。 我在这里描述的特征和能力代表了对AGI的理想化愿景,研究人员和科学家们还在为实现这一目标努力。

36氪:当前我们距离更高一级、具备意识的人工智能有多远?从技术角度,你觉得沿着现有的大语言模型路线,我们可以达成这一目标吗?

Hans: 在讨论更高级、有意识的人工智能前景时,考虑人工智能研究的现状和现有的大语言模型非常重要。

虽然大语言模型在自然语言处理和生成方面取得了重大进展,但关键是要明白它们与有意识人工智能有着本质区别。 大语言模型是根据大量数据中的模式和相关性生成类似人类文本的,但它们缺乏真正的意识或自我意识。

实现更高级别的、有意识的人工智能是一项复杂而多方面的挑战,超出了当前大语言模型的能力范围。意识包括自我意识、主观体验、意向性、对自身精神状态的理解以及其他认知能力。虽然这一领域的研究仍在进行中, 但我们距离在人工智能中实现真正的意识还有多远,仍然是一个悬而未决的问题。

从技术角度来看,尽管现有的大语言模型在能力上令人印象深刻,但并不具备意识的必要组成部分。意识涉及对世界的更深层次理解、抽象推理、上下文理解和代理感,而这些目前在大语言模型中并不存在。

对所有人来说,重要的是要继续推动人工智能研究的边界,探索认知架构、神经科学启发方法和跨学科合作等途径,以进一步加深我们对意识的理解,并开发具有更高级认知能力的人工智能系统。

我们很难预测何时或是否能够按照现有的大语言模型实现有意识的人工智能。开发有意识的人工智能需要在多个研究领域取得突破,包括神经科学、认知科学和哲学,以及人工智能技术的进步。这是一个长期目标,可能需要我们在理解认知和人类思维方面取得重大进展。

作为研究人员,我们必须继续探索和研究意识,同时认识到未来的局限性和挑战。

36氪:回到公司本身,看到reInventAI的德国公司nyonic的定位是,希望开发出面向欧洲需求的基础模型。这个定位具体怎么理解?和现在全球范围内我们看到的大语言模型相比,nyonic的产品会在哪些方面有着怎样的差别?

Hans: nyonic专注于为欧洲构建可信赖的、高效能的基础模型。我们的目标是创建并超越目前全球通用大语言模型的,独特的、专业化模型。

nyonic的大模型和其他大模型主要的区别,在于nyonic的定制和专业化方法。尽管行业中的大多数模型都提供了需要用户微调的通用基础模型,但nyonic定位于开发针对特定行业或地区的专业化垂直模型。例如,nyonic可以为欧洲医疗行业、德国汽车行业或中国传统医药行业创建专门的垂直模型。

36氪:行业模型现在提及很多,在你的眼中行业模型的特点是?

Hans: 模型的专业化程度可能因行业和地区要求而异。有时行业相似的话,只需要根据不同地区的监管差异进行细微调整,而其他情况下,差异可能会很大。例如,如果nyonic想要为公共管理领域创建模型,中国和欧洲的要求和法规将截然不同。

nyonic既提供可以直接使用的预训练垂直模型,又可以提供由用户进一步定制的专有模型实例。在我们的规划中,其中一些服务可能免费提供,而另一些需要付费。训练过程涉及复制和训练的结合,包括预训练,以及通过传统的机器学习技术使用标注数据进行微调。产品方面,我们最终目标是提供专业化的聊天机器人、自然语言访问服务,以及满足不同行业和组织特定需求的硬件和软件解决方案。

36氪:看到你在之前的采访中提及,欧洲企业对大模型在To B领域的应用已经有了很多想法。那么当前欧洲企业在To B场景中落地大模型,比较看重模型具备哪些特点?

Hans:根据我的观察,欧洲公司在B2B领域应用大模型时往往会希望大模型具备特定的特征。过去有许多狭义人工智能的应用被提出,这些应用非常专业化,专注于执行特定任务,而行业对这些模型更泛化的能力并不了解。然而,随着nyonic等新语言模型的引入,将大模型应用于B2B领域会具有明显优势。

欧洲企业看重的一个关键特点是模型内部知识和理解能力的增强。 例如,如果我们希望一个系统可以预测汽车销售额,那么在新语言模型的帮助下,系统将更深入的理解什么是“预测”,什么是“汽车”,什么是“销售额”。这种改进的理解能力能够实现更好的分析、更有洞察力的答案以及更好的整体性能。 因此,语言模型的主要优势在于能根据丰富的知识库提供更全面、更准确的见解。

虽然这些应用本身可能并不十分新颖,但显著的进步在于人类语言与软硬件的交互变得更加便捷。这意味着大家现在可以更轻松地使用自然语言与各种软件和硬件系统进行交流,简化和优化业务流程。

此外,欧洲公司尤其强调质量保证、处理器优化、分析和预测保护的重要性。我觉得随着更多知识融入系统,这些领域的性能有望得到显著提高。语言模型对特定行业(如汽车行业)的扩展理解,使它能够掌握汽车和汽车生产等领域的专业知识。这种专业知识增强了模型在特定行业内的准确性和适用性。

36氪:在当前的生成式AI领域,你觉得美国、德国和中国在技术路线、市场繁荣度上的不同特点是?产生如此差异的原因是什么?

Hans: 美国一直处于人工智能研究与开发的前沿,特别注重生成式人工智能。 美国公司在大语言模型方面进行了大量投资,并由于较早采用和获取先进技术资源而取得了市场成功。 美国的技术路线以创新为核心,不断进行前瞻研究,并建立了支持人工智能初创公司和行业合作的强大生态系统。这造就了一个繁荣的市场。

而另一边,德国明显侧重于精密工程和制造业。 德国的技术路线强调人工智能在B2B领域的实际应用。 德国企业优先考虑人工智能模型的准确性、质量保证和优化,以提升工业流程和生产水平。德国的市场繁荣是由行业专长、卓越工程技术和强大制造业基础共同推动的。德国企业通常在人工智能解决方案中优先考虑效率、可靠性和实用性。

再看中国。中国经历了人工智能的快速增长,这得益于人口众多、政府支持和蓬勃发展的科技行业等因素。中国的技术路线强调大规模数据驱动的模型和应用,侧重于将人工智能落地至面向消费者的服务和电子商务。在海量数据和高度竞争市场的推动下,中国企业在自然语言处理、语音识别和图像分析领域取得了重大进展。 中国市场的繁荣得益于庞大的国内市场、人工智能技术的快速应用以及充满活力的科技生态系统。

每个国家都有独特的优势、挑战和优先级,这些因素决定了它们对生成式人工智能的态度,并影响着人工智能技术在各自市场的进展。

36氪:模型技术的演变也是一个话题。你认为未来大模型的参数会经历快速增加还是逐渐增加?或者在某些情况下,参数是否可能减少?

Hans: 最近我们观察到两种独特的模式。第一种趋势在预料之中,就是不断推动更大规模模型的发展。第二种趋势涉及提高这些模型的效率。因此,我们将看到公司之间的分化,一些力图推动技术的极限,而另一些专注于优化现有技术并在这个基础上创新。

我觉得这两种方式各自都很重要。

一方面,增加参数数量是有必要的,因为我们预计会整合更多的模态。 现有的大模型已经结合了图像和文本,但还有其他需要考虑的模态,如运动、语音、视频和音频。此外,一些行业特定的数据潜力巨大,特别是在B2B市场中的流程数据、传感器数据和时序数据等,它们并不容易在互联网上获得。所有这些元素都可以整合到基础模型中。另外,虽然必要的硬件还没有准备好,但思考用整个互联网的数据训练一个模型的概念很吸引人,随着硬件开发和研究的不断进步,我们可以期待出现更大的模型。

当然我们也必须认识到小模型也有自己的重要性。识别这两种趋势,可以确保公司找到正确的平衡。

36氪:大模型在今年让所有人惊艳。你觉得在不久的将来,大模型还将出现哪些新发展?

Hans: 我认为下一个重大突破将是视频或电影。电影中有剧本、声音,空间关系,音频描述等,这些可以互相进行映射。大模型可以学到从文本中学不到的东西。如果能将电影与剧本进行关联,将会有一个巨大的飞跃。

通过电影,它可以学到一些非常困难的常规事物,可以对世界和文本有更多的了解,将学习到一些目前无法理解的事物和文本。现在系统还缺乏没有世界的图像,如果有了世界的图像,它将更好地关联文本中的事物,比仅仅依靠文本更好。另外,和基础模型结合的机器人技术也很值得关注。

36氪:如果将概念放大一点,你觉得人工智能领域还有哪些值得关注的新进展?

Hans: 一个重要的新领域是机器教学(Machine Teaching),我觉得这将是新的范式。

目前,我们所熟知的是机器学习(Machine Learning)。机器学习的范式是尝试许多不同的算法,并选择最适合特定任务的算法。在大模型中,我们已经拥有一个非常强大的优化算法。现在,我们的重点是通过使用不同的数据、提示、强化学习、微调等方式,充分发挥这个模型的潜力。就像模型从学校毕业后可以学习专业知识一样,这就是机器教学。

机器教学与传统机器学习相对,有4个方面不同。

首先,它更加注重数据质量和多样性,比如引入多语言数据,尤其是欧洲语言和亚洲的一些主要语言。其次,它运用了分阶段学习的方法。例如课程式学习(curriculum learning),就是通过模仿人类的学习过程来加速模型的训练和提高模型的性能,由易到难,由具体到抽象的过程。再者,机器教学拓展理语言模型的能力边界,可以加入记忆模块,更好地支持插件架构,结合外部知识或数据服务、业务应用程序,包括时序数据等。最后,它可以从核心基础模型中导出垂直特定模型,与商业管理、金融、科技、制造业、供应链、医学/药理学、商业流程、商业法律等行业相关联。



各位关注数字时氪的小伙伴,因微信改版,建议大家一定要 星标 【数字时氪】,这样才能很明显看到我们推送的内容,大家一定要星标哇!

步骤:点开数字时氪公众号主页,点击右上角,选择“星标”,这样你就可以每天看到我们新的推送啦!

我们正在建设 「AI领域」主题交流社群 ,欢迎 扫码添加 数字时氪小助手 ,并发送名片或者个人介绍,我们将为您持续推荐相关产业信息和活动。

更多活动信息及行业详情,请关注微信公众号“数字时氪”(微信 ID :digital36kr),期待您的到来。







请到「今天看啥」查看全文