机器人视觉系统中图像分割技术的传统方法介绍1

姓名:寇

学号:21011110234。

随着人工智能技术的不断发展,智能机器人领域也取得了前所未有的发展。尤其是深度神经网络在视觉系统中广泛应用后,取得了很多明显的成果。对于自主移动机器人来说,视觉系统起着非常重要的作用,而图像分割技术在这个系统中起着非常重要的作用。传统的图像分割技术已经基本能够分离图像的前景和背景,但是近年来,随着深度学习算法的发展,人们开始将其应用于图像分割,并提出了许多分割网络,也取得了很好的分割效果。在图像分割的基础上,人们还使分割有了语义类别和标签,这就是现在的语义分割。在介绍语义分割的基础上,介绍了新的任务分割场景、实例分割和全景分割。本文还介绍了最近研究的热点三维点云的语义分割,并阐述了其实现的必要性。

嵌入式牛鼻智能机器人,图像分割,语义分割,计算机视觉。

嵌入奶牛问题的图像分割技术的传统常用方法

镶嵌牛文字

一.导言

计算机视觉,即计算机视觉,是通过计算机模拟人类视觉的工作原理,获取并完成一系列图像信息处理的机器。计算机视觉属于机器学习在视觉领域的应用,是一个跨学科的研究领域,涉及数学、物理、生物、计算机工程等学科。

计算机视觉的主要应用有无人驾驶、人脸识别、无人安防、车辆车牌识别、智能图像传输、3D重建、VR/AR、智能摄影、医学图像处理、无人机、工业检测等。人类驾驶又称自动驾驶,是目前人工智能领域的一个重要研究方向,让汽车自主驾驶或辅助驾驶员驾驶,提高驾驶操作的安全性。目前人脸识别技术已经比较成熟,在很多地方都有应用,人脸识别的准确率比人眼要高。安全一直是我们国家非常重视的问题,也是人们特别关注的问题。很多重要位置都安排了巡逻巡逻,住宅小区、公司也安排了治安巡逻,确保安全。车辆牌照识别目前是一项不成熟的技术。车辆牌照识别用于违章检测、交通流分析、安全带识别、智能交通灯和停车场中的车辆识别。在3D重建之前,广泛应用于工业领域。它可以用来建模三维物体,方便地测量物体的各种参数,或简单地复制物体。计算机视觉的应用有很多,随着技术的发展,应用领域会越来越多。在工业领域中的应用,在机器人技术中的应用等。

对于传统的图像分割过程,通常可以分为五个步骤,即特征感知、图像预处理、特征提取、特征筛选和推理预测识别。通过研究发现,在视觉发展的早期,人们并没有对图像中的特征给予足够的重视。而传统的分割过程是将特征提取和分类分开,然后在需要输出结果的时候再合并,其实现的难度可想而知。

深度学习算法问世后,卷积神经网络在计算机视觉技术中得到了广泛应用,衍生出了很多研究方向。深度学习主要是基于特征来进行比较。比如人脸识别,用卷积神经网络提取两张不同位置人脸的特征,然后相互比较,最后得到比较结果。目前计算机视觉的主要研究方向有图像分类、目标检测、图像分割、目标跟踪、图像滤波降噪、图像增强、风格化、三维重建、图像检索、GAN等。本文主要针对图像分割领域,进行了简要的概述。

图像分割技术是计算机视觉领域的一个重要研究方向,也是图像语义理解的重要组成部分。图像分割是指将一幅图像分割成若干个具有相似属性的区域的过程。从数学的角度来看,图像分割就是将一幅图像分割成不相交的区域的过程。近年来,随着深度学习技术的逐步深入,图像分割技术得到了突飞猛进的发展。与该技术相关的技术,如场景物体分割、人体背景分割、人脸和人体解析、三维重建等,已经广泛应用于无人驾驶、增强现实、安防监控等行业。

二、发展现状

近年来,许多学者将图像分割技术应用到移动机器人的控制中,该技术可以在机器人运动的同时定位、构建地图并分割出不同的前景和背景,使视觉系统扫描到的图像具有语义信息。一些学者还致力于更准确、更精确的分割,不仅可以区分不同种类的物体,还可以对同一种类的不同物体进行分类,甚至在此基础上划分背景。因为我们生活的世界是一个三维空间,所以有学者将图像场景还原为三维,然后使用相关方法对整个三维场景进行分割。图像分割作为计算机视觉研究中的经典问题,越来越受到人们的关注。

?首先是传统的图像分割方法。在传统的分割中,人们利用数字图像处理、拓扑学和数学的知识来分割图像。虽然计算能力逐渐增强,深度学习也在发展,一些传统的分割方法不如深度学习有效,但还是有很多思路值得借鉴。

第一种方法是基于阈值的图像分割。这种方法的核心思想是根据图像的灰度特征给出一个或多个灰度阈值,将这个阈值与图像中的每个像素逐一比较,作为标准值。很容易认为通过这种逐一比较的过程可以得到两种结果,一种是灰度值大于阈值的像素点集,另一种是灰度值小于阈值的像素点集,从而自然分割出图像。因此,我们不难发现,这种方法最关键的一步是根据一定的准则函数,得到最佳的灰度阈值,从而得到合适的分类结果。值得一提的是,如果图像中待分割的目标和背景占据不同的灰度值甚至不同的层次,那么这种方法会得到很好的效果。而且,如果我们只需要为一幅图像的处理设定一个阈值,就可以称之为单阈值分割。但是,如果图像中的目标不止一个,即有多个目标需要提取时,单个阈值分割无法将它们全部分离。这时要选择多个阈值进行处理,分割过程就是多阈值分割。总的来说,阈值分割法有其独特的特点,计算简单,效率高。但由于该方法只考虑了单个像素的灰度值及其特征,完全忽略了空间特征,导致其对噪声敏感,鲁棒性低。

第二种方法是基于区域的图像分割。这种方法有两种基本形式:一种是区域生长,从单个像素开始,逐渐合并相似区域,最终得到需要的区域。另一种方法是直接从图像的全局出发,一点一点逐渐切割到需要的区域。区域生长是指给定一组种子像素,代表不同的生长区域,然后将这些种子像素逐渐合并成邻域内符合条件的像素点。如果添加了新像素,它们也被视为种子像素。

区域分裂和合并的分割过程可以说是区域生长的逆过程。这种方法是从图像的全局出发,通过不断的分裂,得到各个子区域,然后提取目标的过程。另外,在这个过程中,需要对前景区域进行合并。

在区域分割方法中还有一种分水岭算法。这种分割方法受分水岭构图的启发,将图像视为测地线拓扑地貌,使图像中每个像素对应的高程可以用该点的灰度值来表示。分水岭的形成过程实际上可以通过模拟浸没过程来实现。具体来说就是在每个局部最小值的表面扎一个小孔,然后将模型慢慢浸入水中。随着水慢慢浸入其中,就形成了分水岭。

第三种方法是基于边缘检测的分割方法。边缘检测的思想是通过检测不同物体的边缘来分割图像。这种方法是最先研究的方法之一。如果我们把图片从空间域变换到频率域,物体的边缘部分对应高频部分,就很容易找到边缘信息,那么分割问题就变得容易了。边缘检测法可以实现快速准确的定位,但不能保证边缘的连续性和封闭性。当一幅图像中细节信息过多时,会在边缘产生大量的细边,形成完整的分割区域时会有缺陷。

第四种图像分割方法结合了特定的工具。这里说的具体工具是各种图像处理工具和算法。随着图像分割研究的深入,许多学者开始将一些图像处理工具和算法应用到这项工作中,并取得了良好的效果。小波变换在数字图像处理中起着重要的作用,它可以统一时域和频域来研究信号。特别是在图像边缘检测中,小波变换可以检测二元函数的局部突变能力。其次,图像分割基于遗传算法,主要借鉴了生物学中自然选择和自然遗传机制的随机搜索方法。它模拟了生物种群受基因序列控制的进化过程,擅长全局搜索,但局部搜索能力不足。将遗传算法应用于图像处理也是当前研究的热点问题。这里选择这种方法的主要原因是遗传算法具有快速随机搜索能力,其搜索能力与问题域无关。

此外,还有基于活动轮廓模型的分割方法,具有统一开放的描述形式,为图像分割技术的研究和创新提供了理想的框架。这种方法也是一种检测边缘信息的方法,主要是利用曲线演化来检测给定图像中的目标。