计算机视觉是一门研究如何对数字图像或视频进行高层语义理解的交叉学科,它赋予机器“看”的智能,需要实现人的大脑中(主要是视觉皮层区)的视觉能力。
想象一下,如果我们想为盲人设计一款导盲产品,盲人过马路时系统摄像机拍到了如下的图像,那么需要完成那些视觉任务呢?
目标检测:将图片或者视频中感兴趣的目标提取出来,对于导盲系统来说,各类的车辆、行人、交通标识、红绿灯都是需要关注的对象。
当今目标检测已是计算机视觉和数字图像处理领域的重要分支和热门方向,广泛应用于机器人导航、智能监控、工业检测、航空航天等诸多领域,引入计算机视觉技术对减少人力资本的消耗具有重要的现实意义。
目标检测作为CV的一大任务之一,其对于图片的理解也发挥着重要的作用
在深度学习的加持下,目标检测算法也得到了较快发展,与生活息息相关的视觉应用随处可见:人脸识别,姿态识别,商品识别,自动驾驶等。
在本节课上,老师会大家带来生动的讲解,轻松理解Faster-RCNN的原理,以及相比One-Stage一类算法的优势,还会带领大家构建你的第一个目标检测模型,识别自己相册中的实体目标。