1.单击
目录
选项卡以切换窗格。
2.如有必要,展开
文件夹
,然后展开
Seattle_Building_Detection
。
3.右键单击
Seattle_Building_Detection
,指向
新建
,然后选择
文件夹
。
4.对于
新文件夹名称
,输入 Transfer_learning_data 然后按 Enter 键。
5.单击
地理处理
选项卡以切换窗格。
6.在
地理处理
窗格中,单击
后退
按钮。
7.搜索并打开
导出训练数据进行深度学习
工具。
8.为
导出训练数据进行深度学习
工具设置以下参数值:
-
对于
输入栅格
,选择
Seattle_RGB_clip.tif
。
-
对于
输出文件夹
,单击
浏览
按钮。在
输出文件夹
窗口中,浏览至
文件夹
>
Seattle_Building_Detection
>
Transfer_learning_data
。对于
名称
,输入 Training_chips,然后单击
确定
。
-
对于
输入要素类
,选择
Training_examples_larger_set
。
从裁剪影像生成的影像片和训练数据将存储在名为
Training_chips
的文件夹中。
9.对于
类值字段
,选择
Class
。
根据您之前的定义,
Class
字段指定了哪些对象属于哪些标注(在本例中,所有对象均属于类
1
,表示建筑物覆盖区)。
10.对于
切片大小 X
和
切片大小 Y
,验证值是否为
256
。
这些参数用于确定影像片在 X 和 Y 方向的大小(以像素为单位)。在本例中,默认值
256
是不错的选择。
注:
您希望使您的训练片与用于训练原始模型的影像片尽可能地相似。原始模型使用 512 x 512 的影像片训练,这些影像片使用 10-40 cm 分辨率的数据生成。您的 NAIP 影像的分辨率为 1 米。该分辨率下 256 x 256 像素的影像片覆盖的面积大致等同于 40cm 分辨率下 512 x 512 的影像片覆盖的面积。因此,选择 256 x 256 的影像片大小很合适。
要了解预训练模型中最初使用的影像片大小,其中一种方法是查看 dlpk 包。在 Microsoft File Explorer 中,在单独的文件夹中创建一个
usa_building_footprints.dlpk
文件的副本,然后将其扩展名从
.dlpk
更改为
.zip
。右键单击
.zip
文件并提取文件。在提取的文件中,找到
usa_building_footprints.emd
并将其扩展名改为
.txt
。在文本编辑器中打开
usa_building_footprints.txt
,然后查找行
"ImageHeight"
和
"ImageWidth"
。
11.对于
步幅 X
和
步幅 Y
,输入 64。
此参数控制创建下一个影像片时在 X 和 Y 方向上移动的距离(以像素为单位)。此值取决于您拥有的训练数据量。可以将此值设置得更小,从而尽可能多地生成影像片。您可以使用此值进行试验,但在本教程中,已发现值
64
的运行效果较好。
12.对于
元数据格式
,选择
RCNN 掩膜
。
不同的深度学习模型类型需要影像片采用不同的元数据格式。在工作流前面的部分,您注意到预训练模型基于 MaskRCNN 架构。在此,您必须选择该模型对应的值。
提示:
要了解有关任意工具参数的详细信息,请指向该参数然后单击其旁边的信息按钮。