广油联培研究生在人工智能领域国际著名期刊上发表高水平论文

2023/09/16 10:02:13    人浏览

 

近日,广东石油化工学院自动化学院刘美教授与硕士研究生苏鹏在人工智能领域国际著名期刊《Expert Systems with Applications》发表题为“MOD-YOLO: Rethinking the YOLO architecture at the level of feature information and applying it to crack detection”的研究论文。该刊目前为中科院分区一区TOP期刊,影响因子为8.665。刘美教授为通讯作者,苏鹏为论文第一作者,广东石油化工学院为第一完成单位。

论文针对YOLO系列算法可能存在的通道信息丢失以及感受不足的问题,设计了一种Maintaining the original dimension-You Only Look Once(MOD-YOLO)算法,并将其应用在基础设施的裂缝检测上。该算法所有改进方案均可即插即用,首先,提出了Maintaining the original information-Deeply separable convolution(MODSConv),解决了经典深度可分离卷积所存在的原特征层中通道间信息无法交互的问题。第二,提出了Global Receptive Field - Space Pooling Pyramid-Fast(GRF-SPPF),获取全局视角信息并减轻不同尺度大小所带来的影响。第三,提出了Distinctive and average features-Coordinate Attention(DAF-CA),不仅参考平均信息也考虑显著信息,能更准确地找到并增强关键信息。再者,以MODSConv与DAF-CA机制为基础,设计了Maintaining the original information - Deeply separable layer(MODSLayer),通过一种通道不降维的方式保护了通道间丰富的信息,同时以MODSLayer搭建网络的backbond与neck层并网络命名为Maintaining the Original information-Deeply Separable Network(MODSNet)。最后,以MODSConv为基础,以通道不降维和轻量级的思想设计了Maintaining the original dimension light-Decoupled head(MODL-Head),在尽可能轻量级的前提下在预测前尽量保持更多的特征层信息,显著提升了检测精度与检测速度。实验结果表明,我们的算法在裂缝检测时间与YOLOX算法基本持平,并且参数量减少19.7%与计算复杂度降低35.9%的情况下,在裂缝数据集上准确率相较于YOLOX算法提升了27.5%,达到了91.1%。同时在COCO、VOC等数据集上验证了其具有良好的泛化性。裂缝检测整车部署方案被提出并以此实现算法在车辆行驶时的裂缝检测,经过随车实验证明我们的算法能够很好的在车辆行驶中完成裂缝检测任务。

研究得到国家自然科学基金和广东省普通高校重点领域(新一代信息技术)专项基金的资助。

撰稿:苏鹏、周妙娴 审核:任红卫 签发:高志英