语义分割是什么？概念和应用

03/31/2021

语义分割作为计算机视觉领域的关键任务，是实现完整场景理解的必经之路。为了让机器拥有视觉，要经过图像分类、物体检测再到图像分割的过程。其中，图像分割的技术难度最高。

越来越多的应用得益于图像分类分割技术，全场景理解在计算机视觉领域也至关重要。其中一些应用包括自动驾驶车辆、人机交互、AR-VR等。随着近年来深度学习的普及，很多语义分割问题都在使用深度架构来解决，其中最常见的是CNN(卷积神经网)，它的精度和效率都大大超过了其他方法。

语义分割是什么？

语义分割是从粗到细推理的一个自然步骤:原点可以定位在分类，它包括对整个输入进行预测.下一步是本地化/检测，它不仅提供了类，而且还提供了关于这些类的空间位置的附加信息。最后，语义分割通过为每个像素进行密集的预测推断标签来实现细粒度推理，因此每个像素都被标记为其包围对象矿石区域的类。

更具体地说，语义图像分割的目标是给图像中的每个像素都贴上对应的一类所代表的内容的标签。因为我们要对图像中的每个像素进行预测，所以这个任务通常被称为密集预测。这里要注意的事，语义分割是为给定图像中的每个像素分配一个类的任务而并非为整个图像分配一个单一的类，语义分割是将图像中的每个像素都归入其中的一个类。

语义分割的应用

语义分割现在已应用在很多行业的多种应用中，带来了很多便利。

自动驾驶：语义分割为汽车配备必要的感知能力，让汽车可以“观察”路况和周遭环境，从而使自动驾驶汽车能够安全地在道路上行驶。包括行人、交通标志、其他车、可行驶区域、泊车区域等识别，均可使用语义分割技术进行识别。该技术可以使用在2D图像、视频以及3D点云数据中。

例如，澳鹏的3D点云车道线自动标注技术，即可高效快速进行3D点云数据中的车道线，为大规模数据标注和训练提供了更多可能性。

医学影像诊断：配备AI程序进行病灶识别的医疗器械可以增强放射科医生的分析能力，大大减少诊断测试所需的时间。在X光、内窥镜等方面，均有使用语义分割技术的应用，帮助医生快速诊断。

语义分割任务搭建步骤

一、代表任务

将 RGB彩色图像（高度×宽度×3）或灰度图像（高度×宽度×1），并输出一个分割图，其中每个像素都包含一个用整数（高度×宽度×1）表示的类标签。

二、构建一个架构

对于构建这个任务的神经网络架构，一个天真的方法是简单地堆叠一些卷积层（用相同的填充来保存尺寸），然后输出一个最终的分割图。这样通过特征映射的连续变换，直接学习从输入图像到其对应分割的映射；但是，要在整个网络中保留完整的分辨率，计算成本相当高。

三、增加取样的方法

使用几种不同的方法来对特征图的分辨率进行上采样。池化操作是通过用一个单一的值（即平均或最大池化）对局部区域进行汇总，从而对分辨率进行下采样，而 “解池 “操作则是通过将一个单一的值分配到更高的分辨率中，从而对分辨率进行上采样。

四、完全卷积网络

2014年底，Long等人提出了使用 “全卷积 “网络进行端到端、像素到像素的训练来完成图像分割任务的方法。

五、添加跳板连接

通过缓慢地对编码表示进行上采样（分阶段），添加来自早期层的 “跳过连接”，并对这两个特征图进行求和来解决。

六、高级U-Net变体

标准的U-Net模型由架构中每个 “块 “的一系列卷积操作组成。扩张卷曲

七、界定损失函数

澳鹏的语义分割工具：高效语义分割标注

澳鹏拥有超过25年的数据标注经验，我们依托AI辅助智能数据标注平台将为客户的项目量身定制的标注团队和配备专业的人工智能专家，利用“人机协同”的方式为客户提供部署AI模型所需的高质量训练数据。我们的数据标注平台提供多样的标注工具覆盖不同场景。澳鹏的语义分割工具可以圈选、涂选和点选、自定义属性表单、solo模式和高度集成质检和交付流程。如果你需要智能标注工具，请随时与我们的专家联系。

澳鹏提供计算机视觉AI所需的全生命流程数据服务，包括数据采集、数据标注、数据集以及模型测试，为您部署更好的计算机视觉AI进行数据支持。

联系我们