专栏名称: 人工智能学家
致力成为权威的人工智能科技媒体和前沿科技研究机构
目录
相关文章推荐
玩车教授  ·  教授说车 | 当电车司机遇上油车司机 ·  3 天前  
幸福东台  ·  明起,东台人的早饭建议调整一下 ·  2 天前  
51好读  ›  专栏  ›  人工智能学家

用人工智能创建的模型可信吗?

人工智能学家  · 公众号  ·  · 2024-05-30 12:35

正文

来源:战略前沿技术

远望智库开源情报中心 云卷云舒 编译

评估人工智能的真实成本和收益可能很困难,尤其是在半导体行业。

编译自《Semiconductor Engineering》2024年5月6日-由:布莱恩贝利

与更广泛行业中的许多人工智能应用相比,使用人工智能创建的EDA模型需要通过更严格的质量和成本效益分析。如果人工智能做错了,投的钱就打了水漂,所有相关的成本都必须考虑在内。

模型是开发团队可以创建的最昂贵的东西之一,理解从中获得的价值是很重要的。该价值可能以几种方式出现,例如能够在开发流程中更快或更早地执行分析。成本方面也必须仔细考虑。数据从何而来?它有多可靠?创建模型需要花费多少时间或精力?如何核实?最后,必须有人确定这个模型是否符合目的。它是否具有提供预期指导所需的准确性或保真度?是否有一种方法可以验证模型是否产生了正确的决策?测点离决策点有多远?

因此,团队只在绝对必要时才引入新模型应该不足为奇。但是在一个激进的时代,对系统级分析的需求日益增长,需要能够从先前的设计、正在进行的工作中创建模型,或者启用可以帮助自动化流程方面的反馈循环。

模型、执行引擎和人类相互交互的方式有很多,而且已经有人工智能被用来取代或增强这些部分的例子。其中包括:

•创建与常规求解器执行的优化模型;

•创建一个执行常规模型的优化求解器;

•根据需求创建模型,以及

•在反馈循环中使用流程模型来取代或增强人。

行业中可能还会有其他使用模型,未来肯定会有更多。也没有一种类型的AI是有益的。“请记住,许多方法不需要大量的数据集,”Ambiq公司人工智能副总裁卡洛斯•莫拉莱斯(Carlos Morales)说。“考虑强化学习,它有效地依赖于数据合成、迁移学习和少量/无射击学习。这些方法减少了对海量数据集的需求。”

人工智能不是包治百病的灵丹妙药,如果不完全了解正在发生的事情,可能会出现意外。“生成的结果有多好并不重要,”西门子公司EDA设计验证团队的AI ML解决方案经理Dan Yu表示。“你仍然需要一些经典的基于规则的系统来仔细检查生成的结果。以目前的形式来看,人工智能不会立即改变或直接取代人类工人。它更像是一个助手。总是存在不匹配,机器学习本身总是会犯错误。我们永远无法100%确定结果。”

一个流行的用例是为了性能而牺牲准确性。Ansys公司高级产品营销经理Mazen El Hout表示:“当你想要更好的性能或更快的洞察力时,你会失去准确性。”“准确度的损失非常小,但速度方面的收益非常大。这将适用于不需要高保真结果的用例。您不会将其用于最终验证。你正处于设计探索阶段,在这个阶段,最重要的是速度。与传统模拟相比,准确度的小损失并不是一个真正的问题。然而,你可以依靠它来获得所需的见解。”

有这些制衡是很重要的。新思科技产品线管理高级总监马克•塞鲁盖蒂表示:“你想要更早开始,因为你需要开始了解可以实现什么。”“我可能会面临哪些挑战?”我们知道构建这些系统的系统变得更加昂贵,我们知道在开发过程中你发现的问题越深入,它的成本就越高。你需要越来越早地做事情,但它只能在更抽象的情况下更早地完成,因为有些事情你不知道。”

生成的模型在许多领域都有应用。Ansys公司杰出工程师Srinivasa Mohan表示:“降阶模型(ROMs)使用人工智能来创建仿真数据的快速模型,帮助创建电子制造的数字孪生,并提高制造的产量。”“我们还可以研究制造对性能的影响,并优化制造流程以减少变化。除此之外,rom还用于加速IC芯片的设计过程优化,查看功率配置对热性能的影响,并减少节流需求。”

了解这些模型对于了解如何安全地使用它们至关重要。“人工智能是一种自动发现隐藏在数据中的有用规则和关系的方法,”Ambiq公司的莫拉莱斯说。“为了使合成数据有用,数据的创建者必须表达这些规则。如果用于生成数据的模拟没有内置这些隐藏规则,人工智能训练过程将无法找到它们。有趣的是,我们使用模拟来增强我们的真实心电图数据集。我们发现,在某些情况下,我们用合成数据训练的模型在随机噪声中看到了“心跳”信号,这是一种“幻觉”的效果。一旦我们发现了这种行为,我们就必须在模拟器中添加规则以包含这种特殊情况。在大多数领域,有成千上万的规则,所以很难模拟所有的东西。”

物理世界

半导体工业中使用了许多类型的模型,从功能和验证模型到物理模型(如热模型)。莫拉莱斯说:“数据合成在数据代表实体的情况下有效使用,比如街道或飞机。”“这是因为物理学很好理解,我们有几十年的研发时间来模拟现实世界。”

模型和执行引擎总是配对的。Ansys公司的El Hout说:“你通常有一个模型,这是一个基于物理的系统的虚拟表示。“然后使用模拟来评估性能、应力、热或位移。在半导体领域,这可能是电路板的热行为。我们利用人工智能所做的是在不同模型的许多不同变体上使用许多先前的模拟结果——比如,电路板的不同变种——然后我们创建一个基于人工智能的求解器模型。我们正在用基于人工智能的数据驱动求解器取代基于物理的求解器。有了这个新创建的求解器,我们可以非常快速、准确地预测新模型的性能。”

但也有局限性。莫拉莱斯警告说:“通过非监督学习(如大语言模型)训练的模型不适合这种方法。”

平衡属性
模型的创建需要在生成模型所需的时间、模型提供的准确性和模型的执行速度之间取得平衡。Synopsys公司的Serughetti说:“引入自动化模型创建的技术绝对是至关重要的。“这个行业必须小心你给自己的模型带来了多少信息。我们都知道,你在模型中输入的信息越多,模型就越准确。但现在你在模拟性能方面遇到了问题。”

Ansys公司的项目主管肖恩•卡彭特表示:“客户希望从粗略的数量级模型开始,然后提高这些模型的保真度。”“但这是有代价的。计算这些模型需要多长时间?在任务的背景下,你不想把天线的有限元模拟嵌入到飞行模拟中因为那会招致太多的时间损失。您必须调整模型的抽象。我如何得到模型——通常是降阶模型——既能代表我感兴趣的子系统的各个部分,又能保证我的任务模拟准确,或系统的系统模拟准确?”

在某些情况下,数据的缺乏可能导致模型出现问题。莫拉莱斯说:“覆盖率可以被认为是已经合成的可能状态的百分比。”“即使在很小的领域,比如防止机器人摔倒,状态的数量也接近无穷大。这种现象是部署人工智能模型的障碍,其中合成数据占训练数据的很大比例。不过,在较小程度上,它也适用于任何模型。”

在整个流程中,可能需要不同的精度。“一开始,你需要高保真度来训练你的人工智能,”El Hout说。“在工作流程的最后,您再次需要高保真仿真来验证您的设计。基于人工智能的预测只是对特定设计阶段的特定用例的加速。在生成AI模型时,了解用户愿意等待多长时间是很重要的。如果用户愿意为模型等待两天,那么它会更准确,但如果他们想在两个小时内得到模型,它就会不那么准确。训练时间与准确度和数据样本数量成反比。你拥有的数据越多,准确性就越高。你愿意等待的时间越长,就越准确。”
幻觉

并非所有人工智能生成的模型都同样值得信赖。“在一个大的语言模型中,人们说这不是一个预测错误,这是一种幻觉,”西门子公司的Yu说。“但这是一回事。我们已经了解到,对于某些任务,你永远不能相信当前形式的人工智能,从长远来看,人工智能将补充我们现有的验证工具。它将使现有的工具更强大,更准确,使它们运行得更快,因为我们不需要搜索一个大的问题空间。但最终,人工智能仍然需要有人坐在它旁边检查结果。作为人类,我们了解自己的需求,这是人工智能无法立即学会的。今天的人工智能还不具备这些知识。”

但并不是所有的人工智能模型都会产生幻觉。“如果你想识别一只猫,你可以使用人工智能,用大量猫的照片训练它,然后它就会识别出一只猫,”埃尔·胡特说。“在这种用例中,编写能够执行此功能的程序非常困难。这就是我们使用人工智能的原因。但是当我们看到物理问题时,我们已经毫无问题地解决了。我们做得很好,具有很高的准确性和保真度,使用模拟。这里的目标是加速,在接受准确性损失的情况下使预测更快。这并不是因为我们不知道如何去做。这是因为我们想走得更快。”

每当人工智能出错时,重要的是要有正确的检查。瑟鲁盖蒂说:“在改进过程中,你需要提供回过头来说‘我发现了差异’的能力。”“从那个时间点开始,我该如何解决这种差异?”或者我是否有能力回到前一步并检查这个差异?因此,在模型开发过程中需要进行向前和向后的流动,以及模型是如何发展的。”

帮助调试

开发资源的一半以上用于核查。在验证过程中,调试会消耗大量的时间。如果有一个应用程序可以使用人工智能的帮助,那就是它了。“数据和数据的形式比开发流程的其他部分要复杂得多,”Yu说。“我们有代码,我们有验证结果,我们有波形,我们有文档,我们有规范。功能验证的复杂性非常高。我们正在考虑一种全面的方法来部署这种数据平台,以帮助我们的客户收集数据,并获得以前无法获得的额外见解。”







请到「今天看啥」查看全文