RCNN

R-CNN是对滑窗的优化，很多什么都没有的区域进行卷积太浪费，先selective-search出可能有目标的区域

RCNN训练过程

首先通过选择性搜索，对待检测的图片进行搜索出~2000个候选窗口。
把这2k个候选窗口的图片都缩放到227*227，然后分别输入CNN中，每个proposal提取出一个特征向量，
- 也就是说利用CNN对每个proposal进行提取特征向量。
把上面每个候选窗口的对应特征向量，利用SVM算法进行分类识别。

RCNN测试过程

SPP-Net

《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》

在此之前，所有的神经网络都是需要输入固定尺寸的图片，比如224224（ImageNet）、3232(LenNet)、96*96等。这样对于我们希望检测各种大小的图片的时候，需要经过crop，或者warp等一系列操作，这都在一定程度上导致图片信息的丢失和变形，限制了识别精确度。

SPP-Net在卷积层后同时进行三个池化，分别是把图片分成16分，4份和1份，每一份不管是做平均池化还是最大池化，我们知道，输出只有(16+4+1=)25个特征值了，对接后面的fc层就是固定的了，也就是说不需要固定输入图片的大小了。

这就是空间金字塔池化的意义（多尺度特征提取出固定大小的特征向量）。

用卷积算法实现滑窗，加快了时间，但在取得候选区域的选取上仍然很耗时间，于是有了何凯明的

对候选区域，也用卷积来选取，而不是传统的颜色分割来取得色块

在OpenCV的contrib模块中实现了selective search算法。类定义为：

cv::ximgproc::segmentation::SelectiveSearchSegmentation