旷视科技研究院包揽COCO、Places三项世界冠军

来源:未知发表时间:2017-12-20 14:31

  当地时间10月29日上午,在意大利威尼斯召开的计算机视觉国际顶级会议 International Conference on Computer Vision(ICCV 2017)的 “Joint COCO and Places Recognition Challenge” Workshop 中公布了 COCO 及 Places 竞赛排名情况。在共七项挑战项目中,旷视科技研究院团队(Megvii)参与了其中最重要的四项,并获得了三项第一、一项第二的优异成绩,一举击败了来自微软、Facebook、Google、商汤科技等企业,以及卡内基梅隆大学、北京大学、香港中文大学、上海交通大学等高校的竞争者,成为了第一个在 COCO 竞赛中获得冠军的中国企业。

 

COCO Challenges Ranking Result

  MS COCO (Microsoft Common Objects in Context,常见物体图像识别) Challenge 是继 ImageNet(已停办)之后,计算机视觉领域最受关注和最权威的比赛之一,是图像(物体)识别方向最重要的标杆(没有之一),也是目前国际领域唯一一个能够汇集 Google、Microsoft、Facebook 三大巨头,国际顶尖院校以及优秀创新企业共同参与的大赛。与关注整体图像的 ImageNet 图像分类任务相比,COCO 中的物体检测任务更关注的是图像中出现的每个物体的个体(比如各种小物体,各种遮挡物体),因此要求算法对图像细节有更好的理解。这个比赛也代表了继 ImageNet 后的图像识别的最高水平。

旷视科技Face++参赛团队

  COCO 从2015年开始举办,至今已经三届,前两届物体检测冠军分别是 MSRA 和 Google。今年的 COCO 包含四个 Task: Detection Challenge(物体检测)、Instances segmentation(物体分割)、(Human) Keypoint Challenge(人体关键点检测)、Stuff Segmentation(背景语义分割)。其中旷视科技Face++团队参与了前三项任务的挑战,并取得了两项第一(物体检测、人体关键点),一项第二(物体分割)的杰出成绩。

  而 Places 是由 MIT 和 CMU 等高校牵头,在今年新设立的一项旨在深度理解图像场景的国际级计算机视觉类竞赛,今年与 COCO 联合举行。Places 2017 共设有三个任务:Scene Parsing(场景分割)、Instance Segmentation(物体分割)、Semantic Boundary Detection(边缘检测)。旷视科技Face++团队只参与了其中物体分割的挑战,并击败了主要竞争对手 Google,赢得了该任务的冠军。

  而对于产业界来说,机器对于人体、物体和场景的理解十分重要。此次旷视研究院在 COCO 和 Places 竞赛中的成绩足以印证旷视科技在全球范围内的技术领先性。利用具有竞争力的技术优势,旷视研究院与产品中心将持续在产品开发中共同推进技术转化,展开行为识别、场景分割、物体检测和物体分割等技术在互联网金融、智能安防、城市大脑、新零售、手机等实用场景或行业中的应用探索,以实现技术价值最大化。

  旷视科技首席科学家、研究院院长孙剑表示,这次旷视科技能够一举在这个竞争最激烈的比赛中,第一次代表中国企业拿到分量最重的三项冠军,主要依赖三个法宝:

  1.旷视拥有自研并全员使用的深度学习引擎 MegBrain,它使我们可以以最快的速度系统化训练算法;

  2.旷视研究院拥有对深度学习和计算机视觉算法长期而深入的研究积累。虽然旷视很少在国际数据集竞赛上“刷榜”,但其实内部的技术指标一直都非常高,借这次机会拿出来和大家分享一下;

  3.旷视研究院除了拥有充沛的计算资源,更重要的是拥有一个鼓励不断高速创新的环境、和追求极致的文化。