作者:qianlinjun
链接:https://zhuanlan.zhihu.com/p/98703562
最近在整理一篇遥感目标检测论文的relate work部分,趁机把近几年遥感(主要关注)、场景文字旋转目标检测论文方法和code整理一下,时间仓促有疏漏之处望多多指出。
首先放上DOTA数据集官网(web/results.html),目前前五名分别来自武汉大学夏桂松团队、南京理工大学pca_lab、Cyber 公司、中科院电子所以及阿里idst。点开前面加号可以看到有的团队的方法介绍。
DOTA旋转目标赛道实时排名(2019年12-22)
以下方法介绍按照论文提交时间顺序
时间:3 Mar 2017
题目:《Arbitrary-Oriented Scene Text Detection via Rotation Proposals》
链接:6
创新:
应该是第一个基于RPN架构引入旋转候选框实现任意方向的场景文本检测。基于旋转的anchor得到旋转ROI,然后提取相应特征,效果可以
pipeline预定义anchor
时间:11 Apr 2017
题目:《EAST: An Efficient and Accurate Scene Text Detector》
链接:5.pdf
知乎解读:504120
创新:
时间:29 Jun 2017
题目:《R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection》
知乎解读:662351
创新:
时间:Sept. 2017
题目:《ROTATED REGION BASED CNN FOR SHIP DETECTION》
创新:
roi pooling多任务nms
时间:26 Nov 2017
题目:《Learning a Rotation Invariant Detector with Rotatable Bounding Box》
链接:5.pdf
创新:
时间:9 Jan 2018
题目:《TextBoxes++: A Single-Shot Oriented Scene Text Detector》
链接:5.pdf
知乎链接:723456
创新:
textboxes++中采用3x5的卷积核,以便更好的适应长宽比更大的文字
训练过程采用OHEM策略,不同于传统的OHEM,训练分为两个stage,stage1的正负样本比为1:3,stage2的政府样本比为1:6
由于Textboxes++采用了全卷积结构,因此可以适应不同尺度的输入。为了适应不同尺度目标,采用了多尺度训练。
由于计算倾斜文字的IOU较为耗时,因此作者采用级联NMS加速IOU计算,先计算所有所有框的最小外接矩形的IOU,做一次阈值为0.5的NMS,消除一部分框,然后再计算倾斜框的IOU的基础上做一次阈值为0.2的NMS。
时间 1 Dec 2018
题目:《Learning roi transformer for oriented object detection in aerial images》
论文链接:5
创新:
基于旋转框提取roi特征
时间: August 2018
题目:《Toward arbitrary-oriented ship detection with rotated region proposal and discrimination networks》
创新:
时间:17 Nov 2018
题目:《SCRDet: Towards More Robust Detection for Small, Cluttered and Rotated Objects》
链接:6
添加特征融合和空间、通道注意力机制。基于水平anchor,通过RPN预测粗糙ROI, 然后检测头实现对目标的任意角的坐标预测(x,y,w,h,θ),pipeline如下:
pipline
创新:
SF-Net
MDA-Net
时间:3 Mar 2019
题目:《CAD-Net: A Context-Aware Detection Network for Objects in Remote Sensing Imagery》
链接:7.pdf
创新点:
网络pipelinePLCNet结构空间注意力
时间 Aug 2019
题目:《R3Det: Refined Single-Stage Detector with Feature Refinement for Rotating Object》
论文链接:2
创新:
网络backbone使用retinanet 结构feature refinement 模块
最近有几篇检测旋转目标的新论文,思路有点相似。
链接:8
创新:
整体结构采用基于水平anchor的RPN结构,检测头同时输出水平框和旋转框的预测结果。旋转框是在水平框的基础上预测旋转框四个顶点相对水平框四个顶点的偏移量得到的。
从水平框结果得到旋转框结果pipeline 检测头同时输出水平框和旋转框
链接:9
检测头思路和上面那篇比较像,但是整体结构和fcos类似,也就是anchor-free思路,同时引入了注意力机制
未完待续..
本文链接:http://task.lmcjl.com/news/1538.html