关于我们
投资案例
新闻中心
活动入口
社会责任
联系我们
松禾成长关爱基金会
新澳门精准马料大全

智能制造大趋势下的广阔赛道,机器视觉产业链价值涌现

发表于:2023-01-03 来源:

行业概述

机器视觉与计算机视觉的定义

机器视觉是运用一个或多个相机ADC模拟数字转换器以及DSP数字信号处理等赋予机器看见这个世界的能力根据AIA国际自动成像协会的定义机器视觉指利用软件和硬件相结合的解决方案为工业和非工业应用场景里的设备提供基于成像与图像处理的操作指令成像主要由硬件部分实现图像处理主要由软件与算法部分完成对成像结果进行处理与分析随后将分析结果输出至执行单元

计算机视觉是采用图像处理模式识别人工智能技术相结合的手段着重于一幅或多幅图像的计算机分析图像可以由一个或者多个传感器获取也可以是单个传感器在不同时刻获取的图像序列通过对目标物体的识别确定目标物体的位置和姿态对目标物体进行描述和解释

机器视觉与计算机视觉的关联与区别

机器视觉指用机器替代人眼进行测量和判断计算机视觉指利用计算机和其辅助设备来模拟人的视觉功能实现对客观世界的三维场景的感知识别和理解机器视觉和计算机视觉是两个不同的概念侧重点也不同机器视觉主要侧重工程上的应用强调实时性高精度和高速度而计算机视觉侧重理论算法的研究强调理论由于理论的研究发展速度往往快于实践应用也就是说计算机视觉的发展速度要远超过其应用速度因此计算机视觉领域的许多技术目前还难以应用到机器视觉上但是二者仍然共用一套理论系统只是发展的方向不同而已一个侧重实际应用一个侧重理论算法的研究无法互相替代

计算机视觉与机器视觉发展历史

1. 20世纪60年代

1963年Larry Roberts计算机视觉先驱Internet发明者发表论文Machine Perception of Three-dimensional Solids奠定了机器视觉技术研究理论的基础Roberts通过计算机程序从数字图像中提取出诸如立方体楔形体棱柱体等多面体的三维结构并对物体形状及物体的空间关系进行描述Roberts的研究工作开创了以理解三维场景为目的的三维机器视觉的研究Roberts对积木世界的创造性研究给人们以极大启发人们对积木世界进行了深入研究研究的范围从边缘角点等特征提取到线条平面曲面等几何要素分析一直到图像明暗纹理运动以及成像几何等并建立了各种数据结构和推理规则

积木世界

资料来源Machine Perception of Three-dimensional Solids

1966年麻省理工学院发起了一个夏季项目目标是搭建一个机器视觉系统完成模式识别Pattern Recognition等工作提案中多次提到寻找物体的边界Edge Detection以及物体识别Object Recognition这个项目没有成功而计算机视觉作为一个专门研究课题却出现在了历史的舞台上

1969年第一片CCDCharge Coupled Device图像传感器诞生于贝尔实验室为机器视觉行业开启了数码图像采集的大门自此人类社会的各个领域开始与图像和视觉连接在半导体行业诞生与发展的同时机器视觉领域的发展也已拉开帷幕

电荷耦合器件图像传感器CCD是用一种高感光度的半导体材料制作而成能把光线转变成电荷通过模数转换器芯片转换成数字信号数字信号经过压缩以后由相机内部的闪速存储器或内置硬盘卡保存与此相比传统固态电子器件的信息存在和表示方式通常是用电流或电因此CCD对信息的表达具有更高的灵敏度从而可以轻而易举地把数据传输给计算机并借助于计算机的处理手段根据需要和想象来修改图像

资料来源CCD图像传感器-颠覆人类记录影像的方式

2. 20世纪70年代

David Marr公认为计算神经科学的创始人麻省理工学院教授在20世纪70年代提出了一个新的理论——Marr视觉理论是计算机视觉研究领域的第一个重要理论框架并开始形成系统的理论标志着计算机视觉成为了一门独立的学科大大推动了计算机视觉研究的发展

他指出视觉信号处理应该是层次化的底层视觉算法应该成为高级视觉理解的基石Marr视觉理论包含两个主要观点第一三维重建问题即人类视觉的主要功能是复原三维场景的可见几何表面第二从二维图像到三维几何结构的复原过程可以通过计算完成并提出了从图像基元图The Primal Sketch)→2.5维图2.5 Dimensional Sketch→3维模型3-D Model一套完整的计算理论和方法因此Marr视觉理论也被称为三维重建论

其中图像基元图是指获得表示图像中变化和结构的表象这包括检测灰度的变化表示和分析局部的几何结构以及检测照明的效应等处理物体2.5维描述是指对图像基元图进行一系列运算得到能反映可见表面几何特征的表象物体3维描述是指在物体自身坐标系下对物体的描述如球体以球心为坐标原点的表述

David Marr所理解的计算机视觉表示

资料来源Vision: A Computational Investigation into the Human Representation and Processing of Visual Information

近乎同一时期学者们提出了以广义的柱体和草图结构Generalized Cylinder & Pictorial Structure表示人体模型用以简化模型及其计算代价它的基本思想是每个对象都由简单的几何图形单位组成例如一个人可以通过广义的圆柱形状拼接在一起也可以由一些关键元素按照不同的间距组合在一起因此无论哪种表示法都是将物体的复杂结构简化为较简单的形状的一种方式这些研究已影响很长一段时间

广义的柱体和草图结构

来源The ACRONYM Model-Based Vision System

The Representation and Matching of Pictorial Structures

3. 20世纪80年代

80年代以后计算机视觉蓬勃发展新概念新方法新理论不断涌现最具代表性的是出现了主动视觉学派目的视觉学派等主动视觉强调两点一是认为视觉系统应具有主动感知的能力二是认为视觉系统应基于一定的任务或目的须将视觉系统与具体目的如导航识别操作等相联系从而形成感知/作用环目的视觉认为视觉都有目的目的就是行为针对具体的对象和应用场合目的视觉己经广泛应用于工农业及其他各行各业

同时逻辑学和知识库等理论在人工智能领域占据主导地位人们试图建立专家系统来存储先验知识然后与实际项目中提取的特征进行规则匹配这种思想也同样影响了计算机视觉领域于是诞生了很多这方面的方法例如David G. Lowe英属哥伦比亚大学计算机科学系教授在论文Three-Dimensional Object Recognition from Single Two-Dimensional Images中提出了基于知识的视觉Knowledge-based Vision的概念

基于知识的视觉

资料来源机器学习观止

上图中左边是一个普遍接受的基于深度重建的视觉识别模型图示David Lowe提出了右图所示的模型它利用物体的先验知识和准确的验证来解释原本模糊不清的图像数据

在上世纪80至90年代期间手工方法的迅速发展对低级识别很有用1986年John F. Canny加州大学伯克利分校教授提出了基于高斯滤波抽取局部信息的边缘检测算法计算图像中每个像素点的梯度强度和方向对梯度幅度值进行非极大值抑制即寻找像素点局部最大值将非极大值点所对应的灰度值设为0这样可以剔除大部分非边缘点之后应用双阈值的技术即设定一个阈值上界和阈值下界图像中的像素点如果大于阈值上界则认为必然是边缘小于阈值下界则认为必然不是边缘两者之间的则认为是候选项需进一步处理手工方法无需训练运行速度也更快因而在数据和算力短缺的年代得到了广泛应用

John F.Canny提出的边缘检测算法

资料来源A Computational Approach to Edge Detection

4. 20世纪90年代

此时计算机视觉虽然已发展几十年但仍然没有得到大规模的应用很多理论还处于实验室水平离商用要求相去甚远人们逐渐认识到计算机视觉是一个非常难的问题以往的尝试似乎都过于复杂于是有的学者开始转向另一个方向——图像分割Image Segmentation后者的目标在于运用一些图像处理方法将物体分离出来以此作为图像分类的第一步图像分割方向的重大突破来自加州大学伯克利分校的Jitendra Malik加州大学伯克利分校教授和他的学生Jianbo Shi宾夕法尼亚大学助理教授其于2000年在PAMI上多人合作发表Normalized Cuts and Image Segmentation这是图像分割领域内最经典的算法之一

在90年代末到2000年的前十年一个非常有影响力的思想方法就是基于特征的目标识别这段时期经历了从全局特征到局部特征的发展通用的图像识别和检索依然困难主要原因是局部特征到语义的跨度太大1991年Ballard德克萨斯大学奥斯汀分校教授等利用全局颜色统计量表示图像并建立了索引系统

Dana H.Ballard等人提出的颜色索引算法

资料来源Color Indexing

5. 本世纪初期

随着机器学习的兴起计算机视觉领域开始取得一些实际的应用进展例如由Josef Sivic布拉格捷克技术大学教授和Andrew Zisserman牛津大学教授于2003年提出的视觉单词Visual Words可以通过执行对SIFT尺度不变特征变换, Scale-Invariant Feature Transform描述符进行无监督学习成功用于图像检索之后由视觉单词所延伸的词袋模型Bags of Words被广泛应用于计算机视觉中

1SIFT尺度不变特征变换Scale-Invariant Feature Transform

David Lowe于1999年首次提出SIFT并于2004年整理完善后发表于International Journal of Computer VisionIJCV标志着全局特征开始走向通用化SIFT算法主要涉及四个步骤尺度空间峰值检测与选择关键点定位方向确定关键点描述与匹配

SIFT特征对旋转尺度缩放亮度变化等保持不变特性SIFT图像匹配算法首先利用尺度空间的概念建立图像的尺度空间在尺度空间中搜索出图像的局部极值点作为候选关键点去除对比度低的关键点和不稳定的边缘响应点确定关键点的主方向生成关键点特征描述子使每个关键点具有位置尺度和方向信息最后采用特征描述符向量之间的欧式距离度量两个特征点之间的匹配程度

DOGDifference of Gaussian尺度空间极值点检测

资料来源Distinctive Image Features from Scale-invariant Keypoints

关键点描述

资料来源Distinctive Image Features from Scale-invariant Keypoints

以SIFT为代表的局部特征通过对局部图像梯度信息的统计产生了对平移/旋转/缩放等操作的不变性在深度学习爆发之前SIFT是计算机视觉领域最重要的基石之一

2词袋模型Bags of Words

词袋模型原是自然语言处理领域用于文本信息检索和文本分类的技术用它做图像表示模型称为视觉词袋模型需要将二维的图像信息映射成视觉关键词集合这样既保存了图像的局部特征又有效压缩了图像的描述为了使用视觉词袋模型首先要在学习阶段建立视觉关键词的集合在训练图像集中提取出所有局部特征然后对这些特征进行聚类得到的结果是训练集中的普遍特征此类原型特征称为视觉词典

视觉词袋模型在从训练图像集的图片中提取低级别特征后需要使用一种无监督算法如K均值算法对这些低级别特征进行给定聚类中心数目的聚类通过把一个聚类中心当作一个视觉关键词就能把每一个从图像中提取的特征映射到它最接近的视觉词典上并且能把图像表示为一个视觉词典上的直方图特征

由于词袋模型通常忽略了视觉单词之间的空间关系有学者在词袋模型的基础上加入了一些空间信息来弥补词袋模型在空间信息上表示的不足Lazebnik伊利诺伊大学教授等人提出了空间金字塔匹配算法SPM, Spatial Pyramid Matching开创性地将图片进行分块和特征提取以验证图片间的相似度SPM算法考虑了整个图像在不同尺度下的空间信息在不同尺度下将图像分为均等的子区域在每个尺度下计算每个细分子区域的直方图并最终汇聚成一个特征向量进行分类

空间金字塔匹配算法

资料来源Beyond Bags of Features: Spatial Pyramid MatchingFor Recognizing Natural Scene Categories

Paul Viola微软工程师前麻省理工学院教授和Michael Johns三菱电机研究实验室计算机视觉研究员等人利用AdaBoost算法出色地完成了人脸的实时检测并被富士公司应用到商用产品中他们主要是基于Haar特征Haar特征分为边缘特征线性特征中心特征和对角线特征组合成特征模板特征模板内有白色和黑色两种矩形并定义该模板的特征值为白色矩形像素之和减去黑色矩形像素之和Harr特征利用图像区域中灰度值的变化反映物体与周围环境的差异以人脸为例人的眼睛比脸颊颜色要深鼻梁两侧比鼻梁颜色要深嘴巴比周围颜色要深这些特性都可以通过上述模板表达出来把矩形放到人脸区域计算出来的特征值和放到非人脸区域计算出来的特征值差别越大越好这样就可以用来区分人脸和非人脸

通过AdaBoost算法自动筛选出来的对区分人脸和非人脸有用的Haar-like特征

资料来源Rapid Object Detection using a Boosted Cascade of Simple Features

6. 2010年之后

随着并行计算资源不断迭代更新大规模数据库及评测标准相继构建与公开深度神经网络开始崛起2012年Hinton多伦多大学教授谷歌副总裁的博士生Krizhevsky2017年离开谷歌前往Dessa公司工作利用神经网络登顶ImageNet图像分类竞赛前5分类精度超过第二名10%震惊业界并且在高清图像上神经网络首次超越词袋模型2013年起鲜有传统方法参加ImageNet竞赛2014年物体检测语义分割边缘检测等问题被各个攻破

Ross GirshickFacebook AI Research研究科学家2014年提出的区域卷积神经网络R-CNN系列工作是目标检测方法的最主要代表性算法R-CNN首先利用选择性搜索方法生成2,000个最可能是物体的候选检测框然后利用深度卷积神经网络提取这些候选检测框的深度特征最后利用支持向量机进行分类和回归该方法在当时取得了巨大的成功,大幅度提升了目标检测的精度Ross Girshick在R-CNN之后又提出了Fast-RCNN算法提升了检测速度

Faster-RCNN基本结构

图片来源Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

加州大学伯克利分校的Jonathan Long等人于2015年提出的全卷积网络FCNFully Convolutional Networks为图像分割开创了新的途径与经典的CNN在卷积层之后使用全连接层得到固定长度的特征向量进行分类全连接层+Softmax输出不同在FCN结构中使用卷积层去替代全连接层即FCN中只有卷积层所以被称作全卷积神经网络可以接受任意尺寸的图像输入对每一个像素都可进行语义预测最后使得在数据集PASCAL VOC上的结果比2012年的算法结果提高了约20%

2017年Transformer模型由谷歌大脑的一个团队推出并发表于论文Attention is All You Need是一种采用自注意力机制Self-Attention的深度学习模型自注意力机制是人工神经网络中一种模仿认知注意力的技术这种机制可以增强神经网络输入数据中某些部分的权重同时减弱其他部分的权重以此将网络的关注点聚焦于数据中最重要的一小部分Transformer模型最开始应用于自然语言处理NLPNatural Language Processing

Transformer模型基础架构

图片来源Attention Is All You Need

2020年Transformer模型首次被应用到了图像分类任务中并得到了比 CNN 模型更好的结果此后不少研究都开始尝试将 Transformer 模型强大的建模能力应用到计算机视觉领域目前Transformer已经在三大图像问题——分类检测和分割都取得了不错的效果视觉与语言预训练图像超分视频修复和视频目标追踪等任务也正在成为 Transformer 跨界的热门方向在Transformer结构基础上进行应用和设计也都取得了不错的成绩

机器视觉系统构成

机器视觉是人眼的替代和延展如同人类视觉一样它也拥有一套完整的视觉系统典型的机器视觉系统是一个包含硬件软件和算法等诸多单元的应用系统一般包含光源及光源控制器镜头相机视觉控制系统等主要包括成像和图像处理两大部分前者通过硬件部分实现后者由算法及软件构成的视觉控制系统负责对成像进行处理分析输出分析结果至执行机构

1.  2D视觉

2D视觉系统一般的成像原理为通过相机拍摄获取二维图像随后通过各项图像分析算法对被测物体进行检测主要依据为物体在二维空间上的信息和特征另外2D视觉需要测量物体的对比度因此对于光照颜色灰度的变化比较敏感所以测量精度和准确度易受变量照明条件的影响对光源的要求较高

1光源

光源是机器视觉系统中最关键的部件之一通过适当的光源照明可将被测物体的目标信息与背景信息区分突出其特征另外可通过克服环境光干扰获得高品质高对比度的图像同时进一步降低图像处理算法的难度提高系统的精度和可靠性

根据应用场景环境的需求光源可分为很多类型如背景光源条形光源环形光源覆盖型光源等在当前机器视觉领域应用中由于检测对象以及检测环境条件等的不同需求目前尚未有通用型的光源照明系统需针对不同的应用场景以及被测目标来设计合适的光源系统以达到最佳效果

2镜头

机器视觉系统中的镜头相当于人类眼睛的晶状体其主要作用是将成像目标映射在图像传感器的光敏面上分辨率工作距离景深视野范围焦距畸变量光圈等指标都对成像的质量起到关键作用镜头的质量直接影响机器视觉系统的整体性能因此合理选择和安装镜头是机器视觉系统设计的重要环节

3图像传感器

相机检测物体时采集正确照明图像的能力不仅取决于镜头还取决于相机内的图像传感器图像传感器通常使用电荷耦合装置CCD或互补金属氧化物半导体CMOS技术将光信号光子转换为电信号电子其任务本质就是采集光源并将其转换为具有灵敏度和动态范围的噪音平衡的数字图像

图像其实就是像素的集合暗光产生暗像素亮光产生亮像素确保相机传感器的分辨率能适配应用场景的需求至关重要分辨率越高图像细节越高则测量准确度越高零件大小检测公差和其他参数可以指明需要的分辨率

4视觉处理算法和软件

对图像传感器所获得的数字图像进行处理是机器视觉系统的关键所在机器视觉软件就像系统的大脑通过图像处理算法完成对被测目标的识别定位测量检测等任务最后根据处理结果做出决定并传输指令至执行端设备机器视觉软件分为两类——底层算法和二次开发的软件包前者是包含大量处理算法的工具库用以开发特定应用主要使用者为集成商与设备商后者则是封装好的用以实现某些功能的应用软件主要供终端用户使用

随着计算机视觉技术的飞速发展和进步越来越多功能强大的机器视觉技术被应用到各种工业场景中在本报告后续章节会对目前机器视觉领域的若干前沿技术做简要介绍

2. 3D视觉

由于二维图像无法提供三维空间坐标信息因此无法实现对被测物体体积表面角度等特征的测量随着技术的进步当前工业场景对机器视觉精确度和自动化的要求越来越高3D视觉的应用也逐渐增多3D视觉主要是对2D视觉起到补充的作用但其成像原理与2D视觉完全不同根据成像原理的不同3D视觉主要分为以下四种成像技术双目视觉Stereo Vision激光三角法Laser Triangulation飞行时间法ToFTime of Flight以及结构光成像Structured Light Imaging

1双目视觉Stereo Vision

双目视觉成像采用两个相机模仿人类的两只眼睛通过两个视点观察同一个物体以获取在不同视角下的物体特征然后通过三角测量原理来计算图像的视差从而获得物体的深度信息人类的两只眼睛获得的图像是存在差别这个差别被称为视差通过视差可以感知深度信息如下图所示两个相机和被测物体之间构成一个三角形已知两个相机的相对位置和被测物体在左右两个相机中的像素坐标通过计算可以得出物体的三维尺寸和特征点的三维坐标双目视觉成像的深度感知能力会受到两个相机之间距离的限制

双目视觉成像原理

2激光三角法Laser Triangulation

基于光学三角原理根据光源通常为激光物体和摄像头三者之间的几何成像关系来确定空间物体各点的三维坐标激光三角法有单点激光测距和线激光测距下图为单点激光测距的原理解释图激光发射器摄像头与目标物体组成的三角形红三角与摄像头成像点与辅助点组成的三角形蓝三角形成相似三角形通过几何关系计算可得出目标物体三维信息

激光三角测量成像原理

激光三角测量成像对于近距离测量精度非常高但受到其三角几何计算原理的限制精度会随着测量距离的增加而减少因此激光三角测量适用于近距离的工业检测场景

3飞行时间法ToFTime of Flight

飞行时间是从Time of Flight直译过来的简称ToF其基本原理是通过连续发射光脉冲一般为不可见光如近红外光到被观测物体上然后用传感器接收从物体返回的光通过探测光脉冲的飞行往返时间来得到目标物距离ToF方法具有良好的实时性可测量距离相对较远通常为10米至100米

ToF法一般分为脉冲调制Pulse Modulation和连续波调制Continuous Wave Modulation脉冲调制法的原理相对简单如下图所示可直接根据脉冲发射和接收的时间差来测算发射器与物体间的距离因此脉冲调制法又称为dToFdirect ToFdToF具有低功耗抗干扰能力强精度不受距离影响等优点


脉冲调制法成像原理

连续波调制法通常采用的是正弦波调制如下图所示由于接收端和发射端正弦波的相位偏移和物体距离摄像头的距离成正比可以利用相位偏移来测量距离因此连续波调制法又被称为iToFindirect ToFiToF具有原理简单便于集成分辨率高等优点

连续波调制法成像原理

4结构光成像Structured Light Imaging

基本原理是将已知的结构化图案投影到被观测物体上这些结构化图案会因为物体的几何形状和拍摄距离而发生相应的形变如下图所示红外摄像头从另一个角度进行观察通过分析观测图案与原始图案之间发生的形变从而得到图案上各像素的视差再根据相机的参数设定恢复出深度信息结构光三维视觉系统主要由光源摄像机计算单元构成

标定和匹配是构建结构光3D视觉系统必须完成的两个步骤标定是为了确定结构光相机系统的结构参数而匹配则是为了确定投影图案与编码图案对应点的关系根据编码方式的不同主要分为直接编码时间编码和空间编码三种方式不同的编码方式由于原理不同适用场景也不尽相同因此需结合具体场景和需求来选择对应的编码方式

直接编码是根据图像属性对每一个像素进行编码因此在理论上可以达到较高的分辨率但是容易受环境噪声影响测量精度较低时间编码是将多幅不同的编码图案先后投射到物体表面上形成图案序列以获得编码值从而得到三维信息具有易于实现空间分辨率高3D测量精度高等特点但由于需要投影多幅图案因而比较适合静态场景不适用于动态场景空间编码是将一幅具有特定空间分布特征的编码图案投射到物体表面上利用投影图案中每个点和其相邻点的关系进行编码一般只需要单帧投影图案因此可以较好地处理动态扫描问题比较适合动态场景

结构光成像原理


发展驱动因素

政策驱动

制造业是我国立国之本兴国之器强国之基作为制造业大国我国十分重视国内制造业的转型升级随着5G等新一代通信与信息技术的不断发展制造业的智能化发展成为了我国制造业的重点发展方向智能制造作为中国制造2025的重点发展行业能有效提升制造业的生产力水平是政策所大力倡导的行业国家政策的支持为智能装备制造业的发展提供了稳定的发展环境推动了产业的快速发展

自2010年国务院关于加快培育和发展战略性新兴产业的决定中将高端装备制造产业定义为我国国民经济的支柱产业以来陆续制定了当前优先发展的高技术产业化重点领域指南高端装备制造业十二五发展规划智能制造装备产业十二五发展规划等一系列指导文件国家对于智能装备制造业尤其是高端智能装备制造业研发和生产的政策支持力度不断加大

智能制造发展规划2016—2020年提出在 2025年前推进智能制造发展实施两步走战略第一步到2020年智能制造发展基础和支撑能力明显增强传统制造业重点领域基本实现数字化制造有条件有基础的重点产业智能转型取得明显进展第二步到2025年智能制造支撑体系基本建立重点产业初步实现智能转型

2020年9月国家发展改革委科技部工信部以及财政部共同发布的关于扩大战略性新兴产业投资培育壮大新增长点增长极的指导意见中特别强调要重点支持工业机器人建筑医疗等特种机器人高端仪器仪表轨道交通装备等高端装备生产实施智能制造智能建造试点示范研发推广城市市政基础设施运维农业生产专用传感器智能装备自动化系统和管理平台建设一批创新中心和示范基地试点县鼓励龙头企业建设互联网+协同制造示范工厂建立高标准工业互联网平台

2021年12月29日工信部公布十四五智能制造发展规划提出十四五及未来相当长一段时期推进智能制造要立足制造本质紧扣智能特征以工艺装备为核心以数据为基础依托制造单元车间工厂供应链等载体构建虚实融合知识驱动动态优化安全高效绿色低碳的智能制造系统推动制造业实现数字化转型网络化协同智能化变革

在国家大力支持的背景下各省市依托本地产业优势和资源优势相继出台了一系列相关政策当前全国31个省市中已有19个省市对机器视觉行业出台了相关的支持政策其中上海浙江广东等地出台了以下政策

1. 上海市于2021年6月发布上海市战略性新兴产业和先导产业发展十四五规划其中提出重点发展人工智能产业十四五期间人工智能产业规模年均增速达到15%左右智能机器人领域重点研发基于自主决策视觉控制器的智能工业机器人而在2021年4月制定的上海市国民经济和社会发展第十四个五年规划和二〇三五年远景目标纲要提出支持智能机器人研发及产业化应用提升高端数控机床增材制造装备等领域核心技术水平建设人工智能领域国家级重大创新平台在智能芯片智能软件智能驾驶智能机器人等领域持续落地一批重大产业项目

2. 浙江省于2021年4月制定浙江省国民经济和社会发展第十四个五年规划和二〇三五年远景目标纲要指出要实现智能装备产业链现代化聚焦工业机器人数控机床航空航天等重点领域突破关键核心部件和系统等技术打造国内知名的智能装备产业高地而早于2020年8月印发的浙江省培育建设未来工厂试行方案亦提出深度融合应用新一代信息技术充分依托和发挥国家智能制造新模式试点示范企业和省智能制造数字化车间/智能工厂的创建优势从2020年起每年探索培育建设10家左右未来工厂示范引领浙江省制造业数字化智能化绿色化转型发展成为制造业高质量发展和全球先进制造业基地的展示窗口

3. 广东省于2021年4月公布的广东省国民经济和社会发展第十四个五年规划和二〇三五年远景目标纲要提及智能机器人产业集群支持广州深圳珠海佛山东莞中山等地开展机器人研发创新和生产其他各城市积极开展产业配套

国家通过各政府部门在不同方面发布的指导意见与规划从智能制造人工智能智能机器人智能装备智能工厂等多个领域对机器视觉行业发展提供助力为机器视觉产业链上下游企业和相关产品的研发及生产提供良好环境

图表机器视觉相关政策梳理

资料来源各政府官网中金公司研究部

需求端驱动

1. 人口红利的衰退

随着我国老龄化程度的加剧以及人口红利的减弱企业正在寻求智能化转型人力资源紧张劳动力成本提升等压力将推动企业寻找降本增效的代替方案而机器视觉可以提升良率检测和产能利用率并且降低成本因此企业降本增效的巨大需求推动机器视觉应用的加速发展

人口红利逐渐衰退已成为当今中国无可争议的时代大趋势近年来我国大力引导帮扶企业机器换人不断推动技术红利替代人口红利实现减员减能减污和减耗实现生产率和优质品率的大幅提升以现代化自动化的装备提升传统产业推动技术红利替代人口红利发展智能制造成为中国制造产业优化升级和经济持续增长的必由之路

2. 制造业转型升级

经过改革开放40年的快速发展我国装备制造业取得了令人瞩目的成就形成了门类齐全具有相当规模和技术水平的产业体系中国制造2025指出制造业是支撑我国世界大国地位的重要基础然而与世界先进水平相比我国制造业仍然大而不强在自主创新能力资源利用效率产业结构水平信息化程度质量效益等方面差距明显转型升级和跨越发展的任务紧迫而艰巨

近年来随着人工智能技术与制造业的加速融合智能制造作为制造业转型升级的主要路径不断推进工业智能化自动化获得了长足的进步作为AI+工业的主要应用机器视觉也将在政策利好的背景下快速发展另外随着工业自动化智能化转型的深入以及民用产品对智能化需求的不断提升机器视觉作为工业自动化智能化转型的核心技术有望形成更具规模化的产业未来发展空间广阔

3. 疫情下智能制造迎来新机遇

通过新冠疫情可以发现我国大多数制造企业仍然是依靠巨大的人力进行运作制造业真正意义上的复工依然困难重重员工人手不足产业链复工步调不均订单积压产能不足等都成为制造业复工复产面临的主要问题导致工作无法正常推进而此时智能制造企业正凭借智能化及工业互联网带来的生产线人数减少自动化生产网络协同和产出效率高等优势已率先恢复产能在当前企业复工复产中显现出优势借助智能制造增强自身抗风险和修复能力将疫情给企业带来的影响降至最低依靠高科技发展的智能制造行业在疫情期间展现出强大的实力通过无人化智能化的技术支持和产品体系多方面助力社会生产和疫情防控例如机器人用于配送物流餐饮零售安防巡逻医疗康复等领域

因此这次疫情将加快促进我国制造业向智能化无人化转型升级传统制造企业更要加快智能化转型改变目前传统生产方式与产业形态加强自动化信息化和智能化生产体系的建设降低对人员的依赖程度摆脱传统人力的束缚提高工作灵活性保障生产不会因人员变动而产生较大影响

4. 下游市场驱动机器视觉需求

机器视觉的下游应用领域广阔包括消费电子行业半导体产业汽车制造业和工业机器人等这类行业生产工艺的日渐精进和对产品质量要求的提高对机器视觉行业产生巨大的需求近年来我国居民消费水平随着经济发展而逐渐提升对于消费电子的需求日益增长针对消费电子产品生命周期短更新换代快的特征在电子元器件的生产过程中应用机器视觉检测技术是趋势能大大提高精确程度和工作效率而半导体产业和汽车制造业作为目前推动我国经济发展的两个重要产业其市场规模近年迎来高速扩张随着新型技术及工艺环节不断增加行业对检测的技术方法与效率提出了更高的要求机器视觉能够使生产过程更高效产品质量更有保障生产环境更安全可靠机器视觉系统的需求也随之上升工业机器人被各国视为推动产业转型升级的重要切入点可广泛应用于各种行业而机器视觉具有系统实时性好定位精度高等优点能有效地增加机器人的灵活性与智能化程度是实现工业自动化和智能化的重要手段之一

机器视觉前沿技术介绍

计算机视觉模型

1. 基于Transformer的新视觉模型

不同于常见的卷积神经网络CNN模型Transformer是Google在2017年提出的一种自然语言处理NLP经典模型基于Transformer的超大规模预训练模型例如BERTGPT-3在多个NLP任务中都大放异彩Transformer模型使用了自注意力Self-Attention机制使得模型可以并行化训练而且能够拥有全局信息从2020年开始学界逐渐开始研究将Transformer应用到计算机视觉任务中在模型设计和算法流程上取得了创新突破并达到媲美甚至超越经典CNN模型的性能基于Transformer模型或将CNN与Transformer结合的模型将会推动计算机影像识别到达新的高度在计算机视觉领域的多个应用上都具有广阔发展前景

2. 神经网络架构自动搜索NASNeural Architecture Search

神经网络架构例如ResNetDenseNet的设计对深度模型的性能有重要影响但当面临陌生或过于复杂的任务场景或视觉任务涉及多个目标或多个硬件限制这在工业应用中很常见例如希望模型精度高/延时短/推理速度快/存储低AI算法工程师往往无法手动设计出最优的神经网络架构NAS旨在利用智能的机器学习算法来代替人类工程师根据任务目标高效自动地搜索出最优的神经网络架构达到多目标之间的最优平衡例如利用NAS搜索设计的神经网络架构在图像分类目标检测和语意分割等多个机器视觉任务上已经达到甚至超越了人类专家设计的经典网络的性能

小样本学习

1. 迁移学习Transfer Learning

对于一个新的目标任务从头开始学习往往需要大量数据迁移学习旨在把从相似的旧任务Source Domain上学到的知识迁移到新的目标任务Target Domain上, 从而大大降低我们对于在新任务上学习所需的数据量例如利用学习英语经历中得到的知识就可以加快学习法语意大利语的进度迁移学习按照学习方式可分为基于样本的迁移基于特征的迁移基于模型的迁移以及基于关系的迁移其中最为常见的是基于模型的迁移通过在相似的旧任务数据上训练一个深度神经网络将数据中学得的信息转换成神经网络相应的权重在面对新任务时将这些部分权重迁移到新任务的神经网络中然后再用新任务的少量数据对这些神经网络权重进微调fine-tune就达到了迁移之前任务中学来的知识的目标避免了在新任务上从零开始训练一个神经网络的问题

2. 数据增广Data Augmentation

数据增广是深度学习中常用的技巧之一主要通过变换现有训练数据样本来增加训练数据集让数据集尽可能的多样化使得训练的模型具有更强的泛化能力常见的数据增广变换包括水平/垂直翻转旋转缩放裁剪剪切平移对比度/色彩抖动/噪声等以及多个变换的组合

3. 数据生成Data Generation

实际样本非常稀缺或采集成本很高时可以利用AI算法来生成虚拟数据数据生成利用深度学习模型从现有训练数据通常是无监督/未标注数据中学习数据结构和数据概率分布然后直接生成以假乱真的虚拟数据扩充训练数据集常见的深度生成模型种类有变分自编码器Variational Auto-EncoderVAE生成对抗网络Generative Adversarial NetworkGAN

高效数据标注

1. AI辅助标注/预标注

纯人工从头标注大量的复杂数据需要耗费大量的人力成本和时间成本并且容易因为错误标注或标注标准的不统一影响训练数据的质量很多数据标注平台/工具会利用在公开数据集上预训练好的分类检测分割任务模型对数据进行自动智能初步标注人类标注员只需检查并微调初步智能标注的结果避免从头检查标注过程而浪费大量时间例如先利用旧数据集或公开数据集上训练好的目标检测模型定位并画框标记出每张新任务数据图片中的目标人类标注员只需修改错误的标记或者调整目标检测框的尺寸

2. 主动学习(Active Learning)

当采集到的数据量较大时盲目地标注所有数据或者随机标注部分数据会非常低效并加大数据标注的成本和负担主动学习旨在通过机器学习的方法有选择性迭代性地引导数据标注将数据标注的优先级进行排序即让AI算法提示标注哪几张数据能给目前被训练的模型带来最大的信息收获保证每一次标注都能对被训练的AI模型带来最大的提升减少数据标注的次数和成本

行业发展现状

市场规模

机器视觉搭上中国智能制造产业快车复合增长率达25%市场规模百亿递增从整体来看中国智能制造产值增速与机器视觉市场规模增速呈正相关机器视觉2021年市场规模为178亿到2026年预计超500亿2022-2026年复合增长率为25%行业整体发展增速快行业将受技术突破影响较大


图表2016-2026年中国智能制造业产值规模

资料来源甲子光年智库


图表2016-2026年中国机器视觉市场规模及预测

资料来源甲子光年智库

产业链图谱

机器视觉的产业链较长上游由机器视觉系统硬件软件和算法构成目前中国在光源镜头工业相机等硬件和图像处理算法等方面已经成熟但主要集中在中低端市场具体来看光源方面光源的国产化率较高国内有一批具有竞争力的公司奥普特688686维朗光电康视达等工业镜头方面中国的工业镜头高端市场被德国施耐德日本CBC Computar等国外企业垄断但近年来本土厂商迅速发展从中低端市场切入代表厂商有东正光学普密斯等工业相机方面以大恒图像海康威视002415为代表的中国企业在关键技术上有所突破算法方面国内视觉处理分析软件一般建立在OpenCV等开源视觉算法库上做二次开发或直接采购Halcon德国 MVTec公司Vision Pro美国康耐视公司等历经二十多年数据沉淀的第三方商业付费算法库

中游是机器视觉二次开发的系统集成和软件服务商主要根据上游产品以及下游需求进行集成整合越来越多上游企业向中游业务拓展延伸形成自有的完整解决方案行业主要参与者为系统集成商海内外机器视觉装备服务商以及海外机器视觉品牌代理商等其中有以天准科技688003矩子科技300802为代表的产业链中游龙头企业

机器视觉广泛应用于不同下游领域包括电子及半导体汽车制造业食品包装制药医疗等行业其中电子及半导体领域占机器视觉总体分布的46.6%汽车制造业占15.3%是机器视觉工业应用的重点领域半导体行业元器件尺寸较小对产品精度柔性化有较高的要求如锡膏印刷机贴片机AOI检测这类的设备必须使用高性能机器视觉组件因此机器视觉系统在半导体检测等各个方面得到广泛应用3C产业具有技术革新迅速产品迭代块利润高等特性整个产业始终保持着非常活跃的态势在3C产业链上机器视觉技术已经基本覆盖元器件部件和成品的全制造环节的自动化及品质检测与测量汽车制造业主要包括整车制造行业汽车零部件及配件行业等子行业机器视觉的应用包括从初始原料质量检测发展到汽车零部件100%在线测量再对制造过程中的焊接涂胶冲孔等工艺流程进行把控最后对车身总成出厂的整车质量进行把关

图表机器视觉产业链图景

资料来源各公司官网中金公司研究部

部分标定公司简介公司简介核心技术主营业务融资历史等

1. 奥普特688686

奥普特成立于2006年是中国机器视觉行业的领军企业之一,公司最早从核心部件光源进入机器视觉市场随后产品拓展至镜头工业相机视觉控制器视觉处理软件等其他机器视觉部件同时公司在3D激光传感器及深度学习产品方面也有布局经过多年发展公司已经成为具有前端核心零部件自主化能力的机器视觉系统解决方案提供商是国内唯一一家产业链覆盖度可比肩基恩士的中国本土公司

奥普特提供的机器视觉产品已广泛应用于3C电子新能源半导体汽车等多个行业与苹果宁德时代华为欧姆龙安费诺等行业龙头企业深度合作具有较强的客户粘性

融资历史

2019年进行战略融资投资方为晨道资本大靖投资国信证券宁波超兴

2020年科创板IPO上市

2020年进行定向增发投资机构为中国太平青岛国信海通开元国泰君安

2021年进行战略融资投资机构为中信证券

2. 天准科技688003

天准科技成立于2005年最初从精密测量仪器起家陆续针对消费电子新能源PCB等下游行业开发了视觉检测制程装备及解决方案同时面向智能网联领域提供智能驾驶车路协同通用AI计算单元等智能化解决方案

公司下游应用以消费电子生产线为主苹果公司是公司最大的客户公司业务目前在一定程度上对苹果公司存在依赖性但随着公司拓展产品矩阵不断进入新行业依赖情况有所改善除消费电子外公司也积极开拓光伏半导体PCB等新的应用场景经过十多年的深耕与积累公司累计服务全球5000余家中高端工业客户

融资历史

2010年进行天使轮融资投资机构为苏高新金控

2015年进行战略融资投资机构为斐君资本随后新三板挂牌上市

2016年进行定向增发金额为5250万人民币投资机构为斐君资本

2017年进行定向增发金额为4250万人民币投资机构为金沙江创投元禾原点随后因筹备IPO于新三板退市

2019年科创板上市

3. 矩子科技300802

矩子科技成立于2007年是一家自动光学检测系统研发生产商公司核心技术包括机器视觉算法关键部件光学成像系统运动控制技术等在机器视觉检测领域主要产品包括2D AOI3D AOI3D SPIMini LED AOILED AOI半导体AOI等其中3D AOI产品性能已达国际先进水平实现了进口替代公司重点布局PCBMini LED半导体等业务板块累计已服务超过700家海内外知名客户目前已成为苹果华为小米OPPOVIVO等企业的机器视觉设备供应商

融资历史

2013年进行A轮融资投资机构为领庆创投和凯风创投

2019年创业板上市

4. 精测电子300567

精测电子成立于2006年公司从Module段电讯技术信号检测起家目前已向前端Array制程和Module制程延伸客户包括京东方华星光电中国电子天马微富士康明基友达等根据CINNO Research2021年公司 AMOLED AOI检测设备CellModule制程在中国的市占率为15%AMOLED 检测设备Array制程的市占率为3%

公司于2018年成立子公司上海精测向半导体领域延伸专注于前道晶圆量测目前公司已推出存储芯片测试设备膜厚量测关键尺寸量测OCD产品型号已进行多次迭代2018年设立武汉精能布局新能源测试领域主营产品包括锂电池和燃料电池检测设备等后续公司将加快推进锂电池和交直流电源及大功率电子负载检测的技术研发和市场开拓

融资历史

2007年进行天使轮融资投资机构为硅谷天堂

2011年进行A轮融资融资金额400万人民币投资机构为武汉科投硅谷天堂

2016年科创板IPO上市

2021年进行定向增发融资金额14.94亿人民币投资机构为诺德基金华夏基金小米集团海富通基金国泰君安瑞银集团

5. 凌云光688400

凌云光成立于2002年长期聚焦机器视觉及光通信业务目前战略聚焦机器视觉业务是可配置视觉系统智能视觉装备与核心视觉器件的专业供应商视觉产品下游应用广泛消费电子印刷包装新型显示为主要应用领域积累了多领域的优质客户资源与苹果华为鸿海精密歌尔股份京东方华星光电等业内领先公司建立了长期稳定的合作关系在机器视觉方面公司自主研发软件算法与器件全面掌握光机电算软底层技术同时公司是国内少有的拥有独立算法库的企业拥有完全自主知识产权的机器视觉图像处理核心算法平台

融资历史

2012年进行天使轮融资投资机构为中海投资

2019年进行A轮融资投资机构为达晨财智

2020年进行B轮和B+轮融资金额分别为2.5亿人民币和数亿元人民币B轮投资机构为小米集团富士康工业互联网B+轮投资机构为国投创业君度投资同晟资本深圳市裕展精密科技有限公司

2022年进行战略融资金额为2亿人民币投资机构为国家制造业转型升级基金随后科创板IPO上市

6. 聚时科技

聚时科技成立于2018年专注机器视觉深度学习机器人AI技术产品研发公司从工业中最难的半导体场景作为突破口通过尖端AI技术赋能高端制造公司产品矩阵包括聚芯系列半导体缺陷检量测产品半导体制程质量分析系统半导体光伏等行业AI解决方案机器人视觉AI控制与重型机器智能系统等下游应用场景包括半导体先进制造光伏新能源汽车精密制造与无人港口等

深度学习算法和软件研发能力是公司竞争壁垒之一除此之外公司具备跨界能力具有经验丰富的精密机械控制与打光成像团队可支撑聚时科技落地在高端制造领域并形成设备产品闭环

融资历史

2019年继续天使轮和Pre-A轮融资天使轮投资机构为SBI Holdings中科创星Pre-A轮投资机构为国联集团

2020年继续A轮融资金额为1.1亿人民币投资机构为南京江北产投集团湖南高新投兰璞资本华兴源创

2021年进行A+轮和A++轮融资A+轮金额超亿元人民币汇川技术领投快克股份云晖资本敦行资本中芯聚源投资和华成智讯跟投A++轮金额约亿元人民币韦豪创芯领投宁波鋆之涌创业投资合伙企业有限合伙宁波众芯投资合伙企业有限合伙中芯聚源投资跟投

2022年进行战略融资投资机构为韦豪创芯

7. 海康机器人海康威视子公司

海康机器人成立于2016年是面向全球的机器视觉和移动机器人产品及解决方案提供商业务聚焦于工业物联网智慧物流和智能制造海康机器人业务继承了海康多年来在软硬件算法营销体系等方面的优势积累已成为行业中重要的供应商之一海康机器人持续丰富和优化机器视觉产品以VMVision Master算法软件平台为核心培育视觉应用生态携手行业合作伙伴共同开发满足碎片化工业场景需求的应用

融资历史

2016年进行天使轮融资投资机构为海康威视

2021年进行Pre-A轮融资投资机构为阡陌河滨

8. 华睿科技大华股份子公司

华睿科技成立于2016年大华股份旗下的机器视觉子公司专注于机器视觉与移动机器人广泛应用于物流汽车3C锂电光伏和医药等行业

华睿科技集相机镜头光源及软件算法于一身为客户提供高性能硬件设备和通用可编程软件平台逐渐弱化行业属性让机器视觉全面服务于各行各业公司机器视觉产品包含工业相机线扫相机智能相机智能传感器3D工业相机和镜头等系列产品主要用于读码识别缺陷检测测量和定位

公司2017年布局移动机器人目前产品包含潜伏牵引叉取和分拣等机器人主要用于机器视觉领域与机器视觉深度融合全面服务于制造仓储物流等领域

融资历史

2016年进行天使轮融资投资机构为大华股份

9. 思谋科技

思谋科技SmartMore成立于2019年是领先的智能制造与数智创新企业由机器视觉领域国际顶尖专家香港中文大学终身教授贾佳亚创立致力于将20年的机器视觉深度学习等技术积累通过自研的智能工业平台智能传感器产品智能一体化设备以及数智化解决方案为客户提供一站式数字化与智能化服务 

思谋科技已服务卡尔蔡司空客博世佳能大陆集团舍弗勒宝洁联合利华等来自全球的超过100家行业头部企业此外思谋还不断拓宽智造外延基于智造+平台与数智化解决方案逐步在交通广电文旅等多领域落地数智化服务 思谋科技机器视觉技术已惠及千万工业场景与产品产线涵盖了高端消费电子新能源汽车光学制造半导体广电文旅以及智能交通等行业并与国内外多家世界500强企业达成合作赋能产线数百条公司已在香港深圳上海北京苏州杭州重庆新加坡和日本东京等多地设有前沿技术研发和商务中心 

融资历史

2020年进行天使轮Pre-AA轮融资天使轮金额为数百万元人民币投资机构为IDG资本Pre-A轮金额为数千万美元投资机构为IDG资本真格基金联想创投A轮金额为超亿美元投资机构为松禾资本红杉中国基石资本闻天下投资真格基金联想创投IDG资本

2021年进行B轮融资B轮金额为2亿美元投资机构为IDG资本基石资本红杉中国松禾资本联想创投真格基金和喧资本雄牛资本绅湾资本

10. 跨维智能

跨维智能成立于2021年是一家专注于三维视觉软硬件产品研发的高科技人工智能企业公司致力于将先进的三维几何深度学习技术应用于工业智能化领域为客户提供AI视觉算法3D智能相机和高性价比的软硬件一体化三维视觉解决方案让机器人以灵活主动的方式完成复杂环境下基于三维视觉的定位识别引导等任务公司以成像感知一体机系列3D数字孪生与混合智能Mixed AI核心技术为牵引给机器人装上眼睛和大脑以灵活主动的方式解决复杂环境下基于三维视觉的检测定位识别引导等任务为智能制造智慧物流智能家居等垂直领域赋能

融资历史

2022年进行天使轮和Pre-A轮融资天使轮金额为近千万美元投资机构为松禾资本真格基金Pre-A轮金额为亿级人民币投资机构为联创永宣

对于机器视觉发展趋势的一些观点

由于人口红利逐渐褪去政府政策持续助力等因素伴随着科技突飞猛进的发展中国制造业掀起了一股产线自动化与智能化改造的智能制造浪潮机器视觉作为产线上的眼睛赋予各类机器认知的能力为智能制造中不可或缺的重要组成部分发展空间广阔但需深挖产业链价值链相关环节

为更好的了解中国智能制造目前所处阶段以及未来发展趋势本报告撰写团队在2022年第二第三季度集中走访了位于珠三角长三角以及东北等地区的不同行业的国企央企上市公司中小型科技创新企业等并与企业管理技术研发和生产销售团队均做了深入的交流沟通以下是我们通过实地走访调研针对机器视觉行业收集整理总结的一些行业观察与核心观点供大家参考与指正

1. 庞大的市场规模

机器视觉的市场天花板非常高是典型的千亿级别赛道所覆盖的行业领域极为宽泛下游应用从3C消费电子与半导体高精度制造与缺陷检测汽车部件制造检测制药药品外观与封装检测到食品封装与质量检测印刷印刷质量检测均有覆盖其中消费电子的市场规模已超过万亿元人民币而机器视觉在这些行业的渗透率还不高成长空间很广但一些行业内的客户集中度不高较为分散是典型的单一需求小而散的长尾市场人口老龄化加剧人口红利逐渐褪去机器视觉先天优势国产替代需求持续增长政府政策大力支持智能制造等内外驱动力因素持续助力中国机器视觉行业的发展

2. 当前2D和3D视觉突破口

2D视觉起步早发展时间长市场相对成熟行业上游已建立起一定的技术和市场壁垒因此目前国内科创企业需要在视觉算法以及整体解决方案上寻找突破口从技术层面来讲3D视觉为2D视觉的进阶版但具体技术体系框架不尽相同由于发展时间较短国内外市场均未有具备明显技术和/或市场优势的龙头企业该行业还存在较大的机会然而由于智能制造行业中大部分场景都较为简单对算法精度要求并不高加上制造企业对3D视觉技术认知不足付费意愿相对较低导致部分算法技术领先但商务拓展能力欠佳的企业的生存空间进一步缩小甚至会出现如3D工业相机的市场接受价格比2D工业相机还低的情况因此无论是2D还是3D视觉公司都需要在选择和切入一个应用场景前针对该应用场景所涉及的各方面信息做较为深入的调研通过调研去掌握终端用户的真实痛点地区分布付费意愿实际现状以及这些行业痛点是否已被有效解决充分了解终端用户需求后可对自身技术或产品进行评估如能与现有竞品形成较大差异化并形成明显的优势同时能真正地解决用户痛点则证明该应用场景下自身技术或产品存在发挥最大价值的潜力根据需求来寻找技术产品发力方向可事半功倍而非根据技术产品来寻找不同的细分场景需求

3. 国产替代大势所趋

目前国内机器视觉市场无论硬件还是软件大部分市场份额均被海外巨头所占据但由于该领域海外巨头的产品售价昂贵以及本土化程度不足国内许多正在进行或有计划进行智能制造改造升级的传统制造业企业都在积极寻求可替代的国产方案同时如HalconVisionPro这类传统机器视觉算法软件对国产机器人和工业相机等部件的适配度不高软硬件无法有效协同无法进一步发挥硬件设备的最大性能基于以上两点我们认为未来一段时间国内机器视觉行业的软硬件设备国产替代率将逐步上升同时国产厂商可借助适配度更高的应用场景及零部件来提升国内市场的渗透率

4. 非标产品逐渐走向标准化道路

国内机器视觉厂商起步较晚产业基础与人才储备不足同时由于应用场景复杂客户需求多样而且大部分终端客户对机器视觉的认知不够深入缺乏自主设计解决方案的能力因此目前阶段市面大部分产品或技术服务仍然以整套解决方案非标准化业务的方式呈现给终端客户随着国内机器视觉领域的相关厂商不断细分且专业化发展针对机器视觉系统中的各种相关零部件进行自主研发组装着重发展标准化产品如相机光源读码器等并且在交付非标准化解决方案的过程中不断打磨自身技术及产品同时针对一些通用型应用场景研发普适性较高的标准化解决方案我们认为企业的业务与服务模式将逐渐由非标准化转变为标准化方式

5. 软硬件搭配销售进一步提高利润空间

随着人工智能热潮席卷全球近几年机器视觉行业也涌现出许多专注于研发机器视觉软件算法平台的企业但该类型企业普遍遇到一个问题难以明确一个满足供需双方的收费模式一个主要的原因是国内大部分终端客户在可以使用国外免费软件含盗版情况的情况下他们仍然会选择使用这些免费软件尽管这些国外免费软件在运算性能版本升级功能多样性使用便捷性与硬件适配度等诸多方面不同程度的弱于许多国产自主可控的视觉算法软件但由于企业的经营成本控制正版软件付费习惯与意愿较低相关认知储备不足等因素他们仍然会选择免费的模式对于缺乏整体解决方案研发与集成能力的终端客户这种偏软件算法的机器视觉厂商可选择向产业链上游硬件部分延伸通过为其提供集成式软硬件一体的解决方案软件与硬件配套售卖将自研软件集成至较为成熟的硬件设备上将传统硬件厂商作为自身上游来提高自身核心算法软件的附加价值和客户认可度与使用粘性一种可能的思路是设备销售早期阶段可采用自研软件免费试用的方式来提高客户早期整体付费及使用意愿一定程度培养客户新的认知和习惯随着用户数量的增加同步通过社群效应提高用户粘性为后续的软件付费阶段夯实基础

6. 国内硬件厂商发展成熟但软件部分相对落后

目前国内已有许多机器视觉厂商开发出性能优越的硬件产品但通过走访调研我们发现大部分硬件厂商遇到了相同的问题由于算法研发能力欠佳自研算法软件的运算性能无法匹配得上自家的硬件算力需求导致软硬件无法形成有效协同一个主要原因是传统机器视觉厂商难以招聘到顶尖的算法类人才因较为体面的薪资待遇工作环境和职位职称等因素驱动大多数软件算法类人才的就业首选是互联网大厂如腾讯字节跳动等因此在软件门槛无法有效突破的情况下机器视觉厂商只能利用硬件上的性能突破来弥补所匹配的软件算法方面的缺陷但仍无法从根本上解决问题对比之下一些行业内新崛起的机器视觉软件算法类创业公司其优秀的技术团队大多具有丰富的算法研发与产品应用经验二者可形成良好的互补共生关系硬件厂商提供成熟的硬件平台软件厂商提供性能优异适配度高的算法和软件共同解决机器视觉行业内用户的真实需求痛点