Skip to content

astonastonaston/RMAI2020-Perception

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

80 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation



Contributors Forks Stargazers Issues MIT License LinkedIn


Logo

中国科学院自动化研究所--Team Neurons

Time to start!
Wiki

查看Demo · 报告Bug · 提出新特性

相关工作及成果

所内报道:深度强化学习团队提出基于深度强化学习的未知环境自主探索方法

公众号报道:团队新作 | 基于深度强化学习的未知环境自主探索方法

发表文献:

H. Li, Q. Zhang, and D. Zhao. “ Deep reinforcement learning-based automatic exploration for navigation in unknown environment,” IEEE Transactions on Neural Networks and Learning Systems, vol. 31, no. 6, pp. 2064–2076, 2020.

感知模块

目录

软件功能介绍

感知模块功能是通过安装在机器人上的传感器,获取周围的信息。包括检测机器人和装甲板,识别机器人的阵营和编号,获取机器人的位置和姿态,输入给决策和规划模块。

合照

RM AI机器人

机器人安装有雷达,大恒工业相机,USB相机,IMU等传感器,可以感知周围环境信息。同时安装有2台工业相机作为哨兵视觉,获取全局范围内的所有机器人的信息。

1 软件系统架构

哨兵检测系统包括如下几部分:每个哨兵采集图像经过检测算法,输出装甲板和机器人检测框。输出的装甲板或者机器人经过分类得到机器人颜色和ID号,经过距离解算和距离预测得到机器人在世界坐标下的位置,最后经过位姿估计模型,得到机器人的位姿信息。获得整个哨兵感知得到的机器人的ID,颜色,位姿,位置,信息。2个哨兵和2个机器人的信息经过信息融合模块,输出4个机器人的信息。

2 Yolo 检测模型

  • 模型介绍

哨兵将采集到的图像输入到yolov3-boosting模型中后,该模型可以检测图像中的机器人和装甲板,输出其检测框对应的坐标位置,随后机器人的检测框将与其对应的装甲板检测框进行配对。

  • 检测结果

表中的剪枝yolov3-boosting-1模型是进行1次残差模块剪枝1次卷积通道剪枝的结果;剪枝yolov3-boosting-2模型是进行了1次残差模块剪枝2次卷积通道剪枝的结果,剪枝yolov3-boosting-3模型是进行了1次残差模块剪枝3次卷积通道剪枝的结果。

  • 运行效果图

3 Robot分类

  • 算法流程

该模型以Yolo是否可以检测到装甲板为条件,将装甲板目标框信息或车体目标框信息输入到卷积分类网络中,实现了对红1车、红2车、蓝1车、蓝2车、灰1车以及灰2车的有效划分。

  • 分类结果

  • 运行效果图

4 位置获取

4.1 灯条检测及距离解算

  • 算法流程

灯条识别采用传统图像处理的方法。输入为YOLO检测出的装甲板框或者车体框,输出为灯条对拟合外接矩形框的四个顶点坐标。

距离解算部分,首先通过相机标定得到两个哨兵相机的内参,并通过识别场地中的二维码四个顶点以及SolvePnP得到两个哨兵相机外参。最后通过灯条检测识别的灯条对四个顶点坐标以及SolvePnP解算出灯条对中心相对哨兵的位置,根据哨兵相机外参和灯条相对哨兵位置解算出灯条中心的世界坐标系下坐标并加补偿当做车体的位置信息。

  • 解算结果

将解算位置的测试结果分别在x轴和y轴排序后进行误差分析,图中label表示真值,cal_method表示解算方法输出的结果,cal_error表示解算的误差

4.2 距离预测

  • 算法流程

根据哨兵相机高度和俯仰角固定,以及平面假设,利用神经网络来拟合相机坐标系到世界坐标系的转换矩阵,模型为三层的MLP结构,将Yolo检测得到的机器人检测框映射为世界地图坐标。

  • 预测结果

将预测位置的测试结果分别在x轴和y轴排序后进行误差分析,图中label表示真值,mlp_method表示模型输出的结果,mlp_error表示预测的误差

  • 距离解算及距离预测效果图

4.3 位置融合

解算方法:可以利用现有算法解算距离,劣势是目标太小,容易漏检和误检

预测方法:整体拟合较好,但有奇异值

针对两种方法的优劣性进行融合,我们选择在未产生奇异值时相信MLP方法,在产生奇异值时相信解算方法

  • 融合结果

  • 运行效果图

5 姿态估计

  • 算法流程

该模型由左、右两侧哨兵视角的角度分类网络构成。以左侧哨兵视角为例,将哨兵视角下的车体目标框信息及其在世界坐标系下的(x,y)坐标输入到卷积角度分类模型中,有效地实现了角度分类。

  • 位姿结果

上图给出了位姿估计网络模型在左、右哨兵视角下的角度分类准确率。通过图示可以得出,通过将世界坐标系下的角度转换为相机坐标系下的角度,位姿估计模型有效地实现了角度的8分类。

  • 角度预测效果图 其中显示位姿(Pose)为世界坐标系下弧度值,逆时针方向为正,顺时针方向为负。

6 基于卡尔曼的多传感器融合

  • 算法流程

定位模块有多个输入来源,包括两个己方机器人的雷达相机传感器和两个哨兵的相机传感器,我们通过卡尔曼滤波来对传感器数据进行融合。

  • 融合结果

实验证明这种方法能有效的在含有噪声的多种传感器数据中拟合真实值

7 软件效果展示

哨兵检测效果如下:检测框上方第一行显示颜色标号,角度(Pose)第二行显示:位置(x,y), 其中显示位姿(Pose)为世界坐标系下弧度值,逆时针方向为正,顺时针方向为负。

8 公布数据集

以上所有结果均在公布数据集上训练和测试,请点击链接下载,提取码为fd4x

9 各模块运行速度

以上所有实验均在GeForce GTX 1050Ti显卡上进行测试,整个代码运行时间为0.0746s,每个模块运行时间如下:

检测模块:0.04s

Robot颜色标号分类(输入armor)时间:0.0007s

Robot颜色标号分类(输入Robot)时间:0.036s

Robot位置解算时间:0.003s

MLP位置预测时间:0.001s

位姿预测时间:0.002s

依赖环境及运行方式

1 依赖环境

  • pytorch 1.6.0
  • torchvision 0.2.0
  • opencv-python 4.3.0.34
  • python 3.6
  • 要在GPU上运行,需要配置cuda>=8.0

2 运行方法

git clone https://github.com/DRL-CASIA/Perception.git

测试程序:进入demo文件,执行 python main.py

文件目录说明

demo
|— car_classify
|                 |— data                    #基于车体分类模型参数
|                 |— classification_car.py   #基于车体分类函数封装
|                 |— LeNet_car.py            #基于车体分类模型定义
|— angle_classify
|                 |— data                             #基于车体角度回归模型参数
|                 |— classification_angle_camera.py   #基于车体角度回归函数封装
|                 |— LeNet_angle.py                   #基于车体角度回归模型定义
|
|— armor_classify
|                 |— data                #基于装甲板分类模型参数
|                 |— classification.py   #基于装甲板分类函数封装
|                 |— LeNet.py            #基于装甲板分类模型定义
|
|— cfg                              #yolo以及位置预测模型参数文件夹
|— utils                            #辅助函数,用于读取yolo配置文件
|— video_footage                    #测试视频及图片文件夹
|— armor_detect.py                  #基于车体框灯条检测算法
|— main.py                          #主函数
|— armor_detect_withlightbox.py     #基于装甲板灯条检测算法
|— dog-cycle-car.png                #yolo测试图
|— models_nolambda_focallossw.py    #根据配置文件定义yolov3模型结构,读取权重
|— position_predict.py              #基于车体框位置预测以及位置融合算法
|— preprocess.py                    #图像处理,resize等  
|— yolo_detect_v2.py                #yolo算法


开源协议

该项目签署了MIT 授权许可,详情请参阅 LICENSE.txt

鸣谢

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published