English | 简体中文
在部署前,需确认以下两个步骤
-
- 软硬件环境满足要求,参考FastDeploy环境要求
-
- FastDeploy Python whl包安装,参考FastDeploy Python安装
本目录下提供infer.py
快速完成YOLOv7End2EndTRT在TensorRT加速部署的示例。执行如下脚本即可完成
#下载部署示例代码
git clone https://github.com/PaddlePaddle/FastDeploy.git
cd FastDeploy/examples/vision/detection/yolov7end2end_trt/python/
#下载yolov7模型文件和测试图片
wget https://bj.bcebos.com/paddlehub/fastdeploy/yolov7-end2end-trt-nms.onnx
wget https://gitee.com/paddlepaddle/PaddleDetection/raw/release/2.4/demo/000000014439.jpg
# TensorRT GPU推理
python infer.py --model yolov7-end2end-trt-nms.onnx --image 000000014439.jpg --device gpu --use_trt True
# 若安装的python包没有支持该类 则请自行从源码develop分支编译最新的FastDeploy Python Wheel包进行安装
运行完成可视化结果如下图所示
注意,YOLOv7End2EndTRT 是专门用于推理YOLOv7中导出模型带TRT_NMS 版本的End2End模型,不带nms的模型推理请使用YOLOv7类,而 ORT_NMS 版本的End2End模型请使用YOLOv7End2EndORT进行推理。
fastdeploy.vision.detection.YOLOv7End2EndTRT(model_file, params_file=None, runtime_option=None, model_format=ModelFormat.ONNX)
YOLOv7End2EndTRT 模型加载和初始化,其中model_file为导出的ONNX模型格式
参数
- model_file(str): 模型文件路径
- params_file(str): 参数文件路径,当模型格式为ONNX格式时,此参数无需设定
- runtime_option(RuntimeOption): 后端推理配置,默认为None,即采用默认配置
- model_format(ModelFormat): 模型格式,默认为ONNX
YOLOv7End2EndTRT.predict(image_data, conf_threshold=0.25)模型预测结口,输入图像直接输出检测结果。
参数
- image_data(np.ndarray): 输入数据,注意需为HWC,BGR格式
- conf_threshold(float): 检测框置信度过滤阈值,但由于YOLOv7 End2End的模型在导出成ONNX时已经指定了score阈值,因此该参数只有在大于已经指定的阈值时才会有效。
返回
返回
fastdeploy.vision.DetectionResult
结构体,结构体说明参考文档视觉模型预测结果
用户可按照自己的实际需求,修改下列预处理参数,从而影响最终的推理和部署效果
- size(list[int]): 通过此参数修改预处理过程中resize的大小,包含两个整型元素,表示[width, height], 默认值为[640, 640]
- padding_value(list[float]): 通过此参数可以修改图片在resize时候做填充(padding)的值, 包含三个浮点型元素, 分别表示三个通道的值, 默认值为[114, 114, 114]
- is_no_pad(bool): 通过此参数让图片是否通过填充的方式进行resize,
is_no_pad=True
表示不使用填充的方式,默认值为is_no_pad=False
- is_mini_pad(bool): 通过此参数可以将resize之后图像的宽高这是为最接近
size
成员变量的值, 并且满足填充的像素大小是可以被stride
成员变量整除的。默认值为is_mini_pad=False
- stride(int): 配合
stris_mini_padide
成员变量使用, 默认值为stride=32