虽然说AI不是数据的堆砌,但是AI的背后的确是数据的功劳。不然,我们居家必备的小爱同学、天猫精灵们怎么听得懂我们的话?
尤其是今年国家不提GDP增长目标但极力推进高质量发展的背景下,追求更加精准的AI落地成为行业共识。
这意味着,AI数据质量需要进一步提升。
9月6日,在吸引了1.8万家境内外企业的服贸会上(全称是2020中国国际服务贸易交易会),云测数据首次发布了一项数据标注领域的重要成果:云测数据项目最高交付精准度达到了99.99%——这是目前数据标注领域可达到的最高服务标准。
在数据标注行业,交付精度达到99.99%是什么概念呢?
一般来说,在AI行业,算力、算法、数据是三大要素,前两者是设备与能力,数据则是让AI学习的知识素材。
AI数据服务,包含了为AI算法、算力训练及优化提供的数据采集、清洗、信息抽取、标注等服务,以采集和标注为主。
而AI就是通过大批量基于特定标注规则后学习的方法论,因此需要人工将像素、语音信号、文本内容转换为机器能理解、能看懂的数据内容,才可以被机器习得识别处理的方法论。
这些被标注的结果为识别人的特征点,在脸上打上一个个特殊标记,为识别图像中的车辆,通过标注框的方式将对应像素位置范围框选其中。
因此,数据标注的精准度提升,AI才不会把汽车识别为房子,把老虎识别为狮子。在AI越来越强调落地各个产业的今天,数据标注精准度是把控AI质量的关键。
云测数据总经理贾宇航表示,进行99.99%的成果展示,也是向外传递数据标注高质量发展信心。
云测数据是什么公司?
行业内人士可能都知道Testin云测,成立于2011年,是一家以人工智能技术驱动的企业服务平台。实际上,云测数据正是Testin云测旗下AI数据标注服务品牌,是主打高质量AI数据服务的服务商,是算法厂商的上游,图像、语音、文本的数据类型都做到了全品类支持。
雷锋网注意到,之所以他们有底气向行业展示出4个9的精准度,云测数据总经理贾宇航给出的理由在于:云测数据具备全品类的高效标注平台,已经完成了标准化API接口的流程嵌入,做到了模板化的任务创建,并支持了不同种类标注类型和标注方法。
此外,其工作平台包含项目管理、环节工具、标注平台,云测数据所沉淀的是完全自主知识产品的平台技术。
值得一提的是,相比外包的数据标注业务,云测数据自建了数据交付中心以及自有员工,人员稳定。截至目前,云测数据在华东、华北、华南设有数据交付中心和数据采集基地。
对于场景数据的把控和处理,正成为新竞争格局下的硬实力。
雷锋网了解到,云测数据可能更偏向在智能驾驶、智慧城市、智能家居、智慧金融、新零售等场景的AI数据服务。
以自动驾驶为例,在实际落地中,为对物体测距及测速更加精准,引入激光雷达传感器。车载摄像头中的数据与我们人眼相差无几,而激光雷达产生数据与人类所认知的现实世界差距甚远。
据悉,完成激光雷达的相关3D点云数据标注工作,背后需要标注人员对3D点云数据有丰富的处理经验。云测数据在工具层面采用融合标注方式,让标注人员更加直观的将两个世界维度的数据融合一起判断,提高了标注人员的数据处理精准度,同时加快了标注效率。
整体来看,国内的AI发展态势良好,场景化AI数据服务趋势凸显,且AI公司把自己快“逼”上落地极限了,与场景紧密捆绑的数据标注都将迎来发展热潮。
伴随着5G的落地,更多丰富的场景也将井喷,AI行业数千亿的蛋糕,将成为今天企业走向未来的新动力。(雷锋网雷锋网)