专栏名称: 新机器视觉

最前沿的机器视觉与计算机视觉技术

模型部署 | ONNX定义、读写和调试

新机器视觉 · 公众号 · 科技自媒体 · 2024-09-28 21:06

主要观点总结

本文介绍了ONNX（Open Neural Network Exchange）模型的原理、构造方法和调试技巧。文章首先解释了ONNX模型的结构和计算图的概念，然后展示了如何用Python和ONNX API构造一个描述线性函数的ONNX模型。接着，文章介绍了如何用ONNX Runtime运行模型，并用Netron进行可视化查看。此外，还讲解了子模型提取功能在ONNX调试中的应用，以及在实际部署中如何对ONNX模型进行调试和修改。最后，文章指出了在使用PyTorch等框架导出ONNX模型时面临的挑战，包括边序号改变和难以对应PyTorch代码和ONNX节点的问题。

关键观点总结

关键观点1: ONNX模型原理及结构

ONNX模型是一个计算图，节点是算子，边是参与运算的张量。通过可视化ONNX模型，可以了解模型的结构和运算流程。

关键观点2: 如何用Python和ONNX API构造ONNX模型

可以使用ONNX的Python API构造ONNX模型，包括构造张量信息、构造算子节点、构造计算图和封装成模型等步骤。

关键观点3: ONNX模型的运行和调试

可以用ONNX Runtime运行ONNX模型，并用Netron进行可视化查看。ONNX官方提供了子模型提取功能，便于对ONNX模型进行调试。

关键观点4: 在使用框架（如PyTorch）导出ONNX模型时的挑战

使用框架导出ONNX模型时，边序号可能会改变，且难以对应PyTorch代码和ONNX节点。这给调试和修改带来困难。

正文

概述

神经网络本质上是一个计算图。计算图的节点是算子，边是参与运算的张量。而通过可视化 ONNX 模型，我们知道 ONNX 记录了所有算子节点的属性信息，并把参与运算的张量信息存储在算子节点的输入输出信息中。事实上，ONNX 模型的结构可以用类图大致表示如下：

如图所示，一个 ONNX 模型可以用 ModelProto 类表示。

ModelProto 包含了版本、创建者等日志信息，还包含了存储计算图结构的 graph。
GraphProto 类则由输入张量信息、输出张量信息、节点信息组成。
张量信息 ValueInfoProto 类包括张量名、基本数据类型、形状。
节点信息 NodeProto 类包含了算子名、算子输入张量名、算子输出张量名。

定义ONNX

尝试完全用 ONNX 的 Python API 构造一个描述线性函数 output=a*x+b 的 ONNX 模型。我们将根据上面的结构，自底向上地构造这个模型。

首先，我们可以用 helper.make_tensor_value_info 构造出一个描述张量信息的 ValueInfoProto 对象。如前面的类图所示，我们要传入张量名、张量的基本数据类型、张量形状这三个信息。在 ONNX 中，不管是输入张量还是输出张量，它们的表示方式都是一样的。因此，这里我们用类似的方式为三个输入 a, x, b 和一个输出 output 构造 ValueInfoProto 对象。如下面的代码所示：

import onnx from onnx import helper from onnx import TensorProto  a = helper.make_tensor_value_info('a', TensorProto.FLOAT, [10, 10]) x = helper.make_tensor_value_info('x', TensorProto.FLOAT, [10, 10]) b = helper.make_tensor_value_info('b', TensorProto.FLOAT, [10, 10]) output = helper.make_tensor_value_info('output', TensorProto.FLOAT, [10, 10])

之后，我们要构造算子节点信息 NodeProto，这可以通过在 helper.make_node 中传入算子类型、输入算子名、输出算子名这三个信息来实现。我们这里先构造了描述 c=a*x 的乘法节点，再构造了 output=c+b 的加法节点。如下面的代码所示：

mul = helper.make_node('Mul', ['a', 'x'], ['c']) add = helper.make_node('Add', ['c', 'b'], ['output'])

在计算机中，图一般是用一个节点集和一个边集表示的。而 ONNX 巧妙地把边的信息保存在了节点信息里，省去了保存边集的步骤。在 ONNX 中，如果某节点的输入名和之前某节点的输出名相同，就默认这两个节点是相连的。

正是因为有这种边的隐式定义规则，所以 ONNX 对节点的输入有一定的要求：一个节点的输入，要么是整个模型的输入，要么是之前某个节点的输出

接下来，我们用 helper.make_graph 来构造计算图 GraphProto。helper.make_graph 函数需要传入节点、图名称、输入张量信息、输出张量信息这 4 个参数。如下面的代码所示，我们把之前构造出来的 NodeProto 对象和 ValueInfoProto 对象按照顺序传入即可。

graph = helper.make_graph([mul, add], 'linear_func', [a, x, b], [output])

make_graph 的节点参数有一个要求：计算图的节点必须以拓扑序给出（如果按拓扑序遍历所有节点的话，能保证每个节点的输入都能在之前节点的输出里找到）。

拓扑排序：对一个有向无环图(Directed Acyclic Graph简称DAG)G进行拓扑排序，是将G中所有顶点排成一个线性序列，使得图中任意一对顶点u和v，若边∈E(G)，则u在线性序列中出现在v之前。通常，这样的线性序列称为满足拓扑次序(Topological Order)的序列，简称拓扑序列。简单的说，由某个集合上的一个偏序得到该集合上的一个全序，这个操作称之为拓扑排序。

最后，我们用 helper.make_model 把计算图 GraphProto 封装进模型 ModelProto 里，一个 ONNX 模型就构造完成了。make_model 函数中还可以添加模型制作者、版本等信息，为了简单起见，我们没有添加额外的信息。

model = helper.make_model(graph)

构造完模型之后，用下面这三行代码来检查模型正确性、把模型以文本形式输出、存储到一个 “.onnx” 文件里。这里用 onnx.checker.check_model 来检查模型是否满足 ONNX 标准是必要的，因为无论模型是否满足标准，ONNX 都允许我们用 onnx.save 存储模型。

onnx.checker.check_model(model) print(model) onnx.save(model, 'linear_func.onnx')

完整代码如下：

import onnx from onnx import helper from onnx import TensorProto  # input and output a = helper.make_tensor_value_info('a', TensorProto.FLOAT, [10, 10]) x = helper.make_tensor_value_info('x', TensorProto.FLOAT, [10, 10]) b = helper.make_tensor_value_info('b', TensorProto.FLOAT, [10, 10]) output = helper.make_tensor_value_info('output', TensorProto.FLOAT, [10, 10])  # Mul mul = helper.make_node('Mul', ['a', 'x'], ['c'])  # Add add = helper.make_node('Add', ['c', 'b'], ['output'])  # graph and model graph = helper.make_graph([mul, add], 'linear_func', [a, x, b], [output]) model = helper.make_model(graph)  # save model onnx.checker.check_model(model) print(model) onnx.save(model, 'linear_func.onnx')

可以用 ONNX Runtime 运行模型，来看看模型是否正确：

import onnxruntime import numpy as np  sess = onnxruntime.InferenceSession('linear_func.onnx') a = np.random.rand(10, 10).astype(np.float32) b = np.random.rand(10, 10).astype(np.float32) x = np.random.rand(10, 10).astype(np.float32)  output = sess.run(['output'], {'a': a, 'b': b, 'x': x})[0] 
# 比较两个array是不是每一元素都相等,默认在1e-05的误差范围内assert np.allclose(output, a * x + b)

一切顺利的话，这段代码不会有任何报错信息。这说明我们的模型等价于执行 a * x + b 这个计算。

netron 可视化查看：

读写 ONNX

import onnx model = onnx.load('linear_func.onnx') 
# 访问节点graph = model.graph node = graph.node input = graph.input output = graph.output

可以用jupyter- notebook 调试，很方便

能看出 node 其实就是一个列表，列表中的对象有属性 input, output, op_type

当我们想知道 ONNX 模型某数据对象有哪些属性时，只需要先把数据对象输出一下，然后在输出结果找出属性名即可。

读取 ONNX 模型的信息后，修改 ONNX 模型就是一件很轻松的事了。我们既可以按照上一小节的模型构造方法，新建节点和张量信息，与原有模型组合成一个新的模型，也可以在不违反 ONNX 规范的前提下直接修改某个数据对象的属性。

import onnx model = onnx.load('linear_func.onnx')  node = model.graph.node node[1].op_type = 'Sub'  onnx.checker.check_model(model) onnx.save(model, 'linear_func_2.onnx')

调试 ONNX

在实际部署中，如果用深度学习框架导出的 ONNX 模型出了问题，一般要通过修改框架的代码来解决，而不会从 ONNX 入手，我们把 ONNX 模型当成一个不可修改的黑盒看待。

现在，我们已经深入学习了 ONNX 的原理，可以尝试对 ONNX 模型本身进行调试了。在这一节里，让我们看看该如何巧妙利用 ONNX 提供的子模型提取功能，对 ONNX 模型进行调试。

子模型提取

ONNX 官方为开发者提供了子模型提取（extract）的功能。子模型提取，顾名思义，就是从一个给定的 ONNX 模型中，拿出一个子模型。这个子模型的节点集、边集都是原模型中对应集合的子集。让我们来用 PyTorch 导出一个复杂一点的 ONNX 模型，并在它的基础上执行提取操作：

import torch import onnx
class Model(torch.nn.Module):      def __init__(self):         super().__init__()         self.convs1 = torch.nn.Sequential(torch.nn.Conv2d(3, 3, 3),                                           torch.nn.Conv2d(3, 3, 3),                                           torch.nn.Conv2d(3