近期,中国汽车工程学会正式发布《智能网联汽车场景数据图像标注要求与方法》(T/CSAE 212-2021)团体标准。该标准由中国智能网联汽车产业创新联盟提出,国汽(北京)智能网联汽车研究院有限公司联合行业力量编制完成。作为其中唯一一家训练数据服务代表厂商,云测数据与中国科学院自动化研究所、中国汽车技术研究中心、北京汽车研究总院、一汽股份、地平线、易图通、RoboSense(速腾聚创)等参与单位共同起草。
该标准的发布旨在为行业提供场景数据图像标注的基本规范,促进场景数据图像标注的标准化、提升场景数据的通用性和易用性,进而助力智能网联汽车的研发和测试,推动行业快速发展。
一、标准研制背景
新一代科技革命和产业变革促使智能网联汽车成为全球汽车产业发展的战略方向,数据作为原料,驱动着汽车智能化的进程。近年来,国内外各企业、高校及科研院所发布了众多自动驾驶数据集,包括KITTI、nuScenes、Lyft、Waymo、ApolloScape、A2D2和福特等,但是目前尚无统一的场景数据标注要求和方法的相关标准,数据标注形式各异、质量参差不齐。
《智能网联汽车场景数据图像标注要求及方法》的制定结合了中国特有的交通情况和道路元素,与业界各家单位进行多次讨论协商。该标准的架构分为使用范围、术语定义、标注方法、内容要求。
二、规范标注内容,提升数据利用率
标准在制定过程中充分调查了我国当前数据标注行业的现状,对国内外自动驾驶公开数据集进行研究,同时结合中国特有的交通情况和道路元素,明确了适用于我国智能网联汽车场景数据图像标注的内容范围。
本标准规范了场景图像数据的标注内容,包括交通参与者、交通信号灯、交通标志、交通标线、可行驶区域、场景采集环境共六类内容,同时参考国内外标准又对这六类内容进行了子类划分,以满足实际工程应用需求。标注内容的统一化,能够提高标注数据的利用率,可以减少重复标注造成的资源浪费。
三、规范标注方法,提升数据通用性
目前标注行业各企业对图像标注的要求与方法都各不相同,标注结果文件各异,严重影响后续数据的统一使用。同时大部分公开数据集并非基于场景进行标注,存在对于车载感知算法的训练和测试针对性低的问题。
为了有效地解决上述问题,本标准对标注流程和标注结果的保存形式进行了规范,以提升标注数据的通用性。
四、规范评估要求,提升标注质量
目前业界对于场景数据图像标注质量没有统一的评估标准,图像标注的质量参差不齐。为了解决该问题,提高图像标注的质量,本标准规范了场景图像数据的评估方法。
五、结语
《智能网联汽车场景数据图像标注要求及方法》是智能网联汽车场景系列标准的重要组成部分,标准的研究和制定对我国智能网联汽车场景数据标注的标准体系建设具有重要意义,填补了我国在智能网联汽车场景数据标注标准的空缺。
——国汽(北京)智能网联汽车研究院有限公司李润