YOLODetect YOLO推理
YOLODetect 算子用于在图像中实现目标检测。
说明:RVS 的 GPU/CPU 版本均可使用该算子。
type | 功能 |
---|---|
YOLO | 用于 YOLO 网络的推理,可以获得图像中目标的位置掩码(像素区域) |
YOLOClass | 用于 YOLO 网络的推理,可以获得图像中所有目标的位置掩码(像素区域)同一个类别的所有目标的掩码共用一张输出图像 |
YOLO
算子参数
-
权重文件路径/weight_file_path
:训练完成后的权重文件地址。 -
物体得分阈值/obj_score_threshold
:目标得分阈值,得分低于阈值的目标会被淘汰,取值范围:[0,1] 。默认值:0.3。 -
IOU 阈值/iou_threshold
:目标重叠度阈值,彼此重叠度高于该阈值的多个同类别目标,仅保留得分最高的目标。取值范围:[0,1] 。默认值:0.4。 -
选择类别/select_class
:是否仅推理一个或多个指定的类别,默认为空。类别名用字符串的形式写入,如果为多个,则用空格隔开。 -
使用设备/device
:训练网络时所用的设备。可选参数:“gpu”与 ”cpu“ 。 -
重置/reset
:参数重置。在执行了一次推理之后,如果对上述参数中的任何一个进行了修改,则还需要勾选该重置
参数,否则上述参数的更改不会生效。重新触发执行一次算子,该参数会自动由勾选状态重新变为非勾选状态。 -
识别结果图像/show_result
:设置推理结果示意图在 2D 视图中的可视化属性。-
打开推理结果示意图可视化。打开能更直观显示推理结果,利于调试。
-
关闭推理结果示意图可视化。关闭可视化可以缩短算子对结果图像进行着色处理的时间。
-
-
Mask列表/mask_list
:设置Mask 列表
输出端口的图像内容在 2D 视图中的可视化属性。其中每一张图像都是一张灰度图,背景像素为 0,目标区域为 255 。 -
Mask名称列表/mask_names
:设置目标对应的类名曝光属性。打开后则可以将Mask 名称列表
输出端口的内容绑定到交互面板上的输出工具表格并输出显示。-
打开曝光。
-
关闭曝光。
-
数据信号输入输出
输入:
-
图像/image
:-
数据类型:Image
-
输入内容:需要推理的图像数据
-
输出:
-
识别图像结果/show_result
:-
数据类型:Image
-
输出内容:图像推理结果的效果示意图
-
-
Mask列表/mask_list
:-
数据类型:ImageList
-
输出内容:图像推理后获得的所有目标的掩码图,每个目标在List中的位置同下述
Mask 名称列表
保持一致。各个目标按照对应的得分从高到低排列。
-
-
Mask名称列表/mask_names
:-
数据类型:StringList
-
输出内容:以 String 形式存放各个目标对应的类名
-
功能演示
本节将使用 YOLODetect 算子的 YOLO 神经网络模型对加载的图像进行推理。获得图像中的目标位置掩码(像素区域)。与 AIDetectGPU 算子的MaskRCNN模块类似,请参照该章节功能演示模块。
MaskRCNNClass
算子参数
-
Mask类别列表/mask_class_list
:设置Maks 类别列表
输出端口的图像内容在 2D 视图中的可视化属性。其中每一张图像都是一张灰度图,代表某一个类别的所有目标的掩码图。Maks 类别列表
中的类别,按照类名文件中类别的先后顺序进行排序。每张 mask 图像的背景像素为 0,每一个目标按照得分从大到小的顺序依次使用1、2、3…等像素。比如一张 mask 图中像素为 1 的一块区域,代表该类别中得分最高的目标的像素位置。 -
其余参数
:与 MaskRCNN 描述一致。
数据信号输入输出
输入:
-
image
:-
数据类型:Image
-
输入内容:需要推理的图像数据
-
输出:
-
show_result
:-
数据类型:Image
-
输出内容:图像推理结果的效果示意图
-
-
mask_class_list
:-
数据类型:ImageList
-
输出内容:图像推理后获得的所有类别目标的掩码图,详细说明见上述“算子参数”——
Maks 类别列表
的介绍。
-
-
mask_names
:-
数据类型:StringList
-
输出内容:以String形式存放所有的类名,顺序同类名文件保持一致,并且同上述
Maks 类别列表
保持一致。
-
功能演示
本节将使用 YOLODetect 算子的 YOLOClass 神经网络模型对加载的图像进行推理。获得图像中的目标位置掩码(像素区域)。与 AIDetectGPU 算子的MaskRCNN模块类似,请参照该章节功能演示模块。