赛事一览
遥感图像物体目标检测
  • 报名开始时间 2022-08-06
  • 报名结束时间 2022-10-07
  • 总奖金池 ¥1000000

一、项目概况

1、大赛介绍:

  • 数字经济时代,算法作为一种战略性科技要素已成为推进数字技术与实体经济深度融合的核心支撑。为发挥国家实验室作用,推动粤港澳大湾区大数据与人工智能算法生态体系建设,琶洲实验室(黄埔)受广州市黄埔区政府委托,自2022起创办《粤港澳大湾区(黄埔)国际算法算例大赛》(以下简称“大赛”),旨在打造大湾区首个以算法为主题的国际型竞赛,以此推动原始创新, 并带动数字经济的高质量发展。

  • 大赛以当前数字技术发展趋势和现实应用需求为牵引,面向全国遴选优质算法、汇聚全球高精尖技术、招揽国际算法高端人才。大赛坚持以科学性、引领性、实用性为原则,聚焦大数据、人工智能、物联网、云计算、元宇宙等新一代数字技术和互联网+、智能+等数字经济场景。 大赛采取每年聚焦不同主题的方式开展。首届算法大赛聚焦后深度学习时代AI 基础算法和智慧城市、智能制造等领域内的行业算法场景。

 

2、大赛赛程安排:

2022年7月20日-11月15日

  • 07月20日:大赛开启预报名

  • 08月06日10:00:大赛正式开启报名,初赛数据集发布,下载数据集,线下开发

  • 08月16日10:00:开始提交测试结果CSV文件在【初赛A榜】

  • 10月07日10:00:大赛报名截止

  • 10月07日14:00:【初赛A榜】截止提交结果

  • 10月08日10:00-10月12日12:00:前20名的参赛队伍到【初赛B榜】提交Docker文件

  • 10月12日-10月21日:进行成绩审核及复现

  • 10月22日:【初赛B榜】结果宣布。任务前15名进入决赛阶段

  • 11月1日10:00——11月7日18:00:决赛A榜开放,公开决赛测试集,选手下载并在原模型上重新测试,提交结果至平台,提交1次

  • 11月7日18:00——11月9日18:00:决赛B榜开放,选手提交审核docker文件

  • 11月10日——11月15日:评测组进行最终评测

  • 11月17日:公布决赛答辩名单

 

3、大赛参赛人员

大赛面向全社会开放,个人、高等院校、科研单位、企业、创客团队等人员均可报名参赛;

每位选手仅能加入一支参赛队伍,每只队伍组队上限5人。

注:(1)大赛组织机构单位中除了擂台赛,涉及题目编写、数据接触的人员禁止参赛;

     (2)主办方和竞赛制赛道出题方可参赛,不参与排名。

 

“关于组队”

您需要以团队为单位来参与竞赛,即便您是单人参赛也需要创建一支队伍。

组队详情:点击https://www.cvmart.net/document


 

“关于海外选手报名”

报名表单:http://extremevision.mikecrm.com/IMtMMEL

注:海外报名选手可以先进行注册,注册后填写报名表单,进行后台人工审核信息,1-2个工作日后邮箱反馈,即可到平台完成报名赛题。

 

4、报名须知:

1)在琶洲实验室(黄埔)官方活动页面进行报名参赛,后登录极市平台进行下载数据集,线下开发后提交CSV预测结果文件;

2)确保报名信息真实有效,重复报名或报名信息不真实,将取消参赛资格及激励;

3)参赛必读手册:https://www.cvmart.net/community/detail/6631

4)大赛官方微信群,扫码加入社群,及时获取大赛信息

 

二、赛制设置

1、竞赛制赛道介绍

竞赛赛道瞄准行业领域发展的共性关键技术,聚焦智慧城市、智慧健康、智能制造、智慧金融等行业领域,开发优质算法,以人工智能技术作为推动力,实现革命性的产业创新。竞赛制赛道将由各领域的国内头部企业针对其发展的行业共性的“卡脖子”难题定义赛题任务,并提供真实场景数据,面向全球汇聚大数据与人工智能高精尖技术,招揽全球人工智能算法高端人才。

 

2、赛题介绍

本竞赛赛题聚焦遥感图像物体目标检测任务,参赛队伍基于国产计图深度学习框架,使用实际数据集训练遥感图像目标检测模型,实现对遥感图像物体目标的精准识别。

 

3、赛题比赛规则

大赛分为初赛和决赛两个比赛环节。

 

- 线上初赛

初赛时间:2022年8月6日至2022年10月07日

初赛形式:初赛分为A、B榜。

【初赛A榜】

参赛队伍需使用“计图”深度学习框架,对本赛题出题方提供的数据进行算法设计和训练,并针对出题方提供的测试数据提交测试结果CSV文件,主办方进行评测并返回结果。

【初赛B榜】

A榜前20名队伍应将代码、训练后的模型参数、运行环境与运行说明等文件打包成Docker,将Docker上传至云盘,云盘链接写进txt文件中压缩为zip提交。

之后由主办方在“计图”框架上对选手的A榜成绩进行复现,使用选手提供的环境和训练后的模型进行前向测试应能够复现A榜的结果,误差在1%以内;选手还应保证通过提供的环境和模型进行训练并测试与A榜结果接近,并配合主办方进行相关测试。确保无违规作弊行为并复现成功的前15名队伍进入决赛,若发现有队伍存在违规作弊行为或无法复现结果,决赛名额依照A榜成绩顺延。

 

- 线下决赛 

决赛时间:2022年11月1日-11月15日

决赛形式:

【决赛A榜】

决赛不再训练新的模型,选手应使用初赛提交的模型对决赛测试集进行评测,并提交评测结果CSV文件。

【决赛B榜】

组委会根据参赛者提交的CSV文件进行评测,排名前8名的队伍提交docker文件进行成绩复现,确保无违规作弊行为后进入答辩环节。

 

-答辩环节:

评测委员会将根据参赛者的技术思路和决赛性能指标进行综合评分,评选出最终获奖队伍。

 

4、注意事项

  • 选手应能在“计图”框架上训练并测试复现所提交的结果,成绩才有效。

  • 训练时禁止引入任何测试集(包括初赛及决赛测试集)数据。

  • 本竞赛仅可使用比赛主办方与擂主提供的数据、公开数据集(指在2022年7月20日前已经公开,且所有人均可获取的数据集)、合成数据(不可使用非公开数据集进行数据合成;若使用合成数据,需提交文档说明清楚数据合成方法),不得使用私有数据进行训练或数据合成。各参赛队伍必须在提交文档中说明清楚使用的其它公开数据集的来源、规模及下载地址。

  • 选手允许使用基于ImageNet的预训练模型以及JDet中提供的预训练模型,使用其它预训练模型应保证在所提交的环境中能够使用Jittor复现预训练模型的训练过程。

  • 初赛前15名及决赛前8名的队伍,需要向主办方提供完整的训练与测试代码、模型参数以及详细的训练流程说明(包括GPU设置,数据使用情况、模型情况、训练参数设置、训练流程等,打包成docker)进行官方复现与测试,并能在合理的时间内完成复现。在主办方进行代码测试和复现过程中,相关的队伍有义务配合主办方进行代码复现(包括合成数据的复现)。无法提供代码进行测试及复现的队伍、或不配合进行代码测试及复现的队伍,将被取消获奖资格。

  • 若发现有队伍存在违规作弊行为,决赛及获奖名额排名顺延。

  • 违规作弊行为包括但不限于:

    • 模型代码与文档描述不符

    • 提交代码无法复现出评测结果

    • 利用测试集训练模型


一、背景及意义

遥感图像处理关注目标检测、语义分割和实例分割等不同视觉任务在遥感图像中的应用,在灾害防控、城市规划、环境监测和国土安全等领域有着重要作用。然而,遥感图像具有物体尺度差异较大、物体分布较密集、图像分辨率高、旋转变化大等特点,因此针对自然图像的通用算法和模型效果往往不佳,需要专用的遥感算法和模型。

                                          图 1遥感图像目标检测示例

遥感图像物体检测任务旨在从遥感图像中检测出所关注物体的旋转包围盒(Oriented Bounding Box, OBB)及其类别。目前遥感图像目标检测方法仍存在较大改进空间,本竞赛赛题聚焦遥感图像目标检测任务,参赛队伍基于“计图”国产深度学习框架,使用实际数据集训练遥感图像目标检测模型,实现对遥感图像中指定目标的精准识别。

 

二、赛题描述

比赛要求选手使用赛方提供的FAIR1M-1.5数据集,使用Jittor框架训练遥感图像目标检测模型,并对测试集的图像输出图像中物体的旋转包围盒及其物体类型。

 

1、计图(Jittor)是由清华大学计算机系的图形学实验室团队研发的深度学习框架,它完全基于动态编译(Just-in-time),内部使用创新的元算子和统一计算图,使其易于使用且效率高于Pytorch等国际主流框架。

2、本次比赛要求选手在Jittor框架上训练和测试网络模型,提交代码进行审查,并承诺在比赛后对项目进行开源。

3、JDet中提供了本次比赛的数据处理脚本及基线模型,请选手参考:      https://github.com/Jittor/JDet/blob/master/docs/fair1m_1_5.md

4、Jittor相关资源:

     Jittor官网:https://cg.cs.tsinghua.edu.cn/jittor/

     Jittor开发者交流QQ群 :761222083

Jittor团队基于Jittor深度学习框架开发了遥感图像目标检测算法库JDet,对现主流遥感图像目标检测算法进行整理重构,统一接口,提升易用性,并且借助Jittor深度学习平台的优势,使其更高效、稳定运行,并且支持多种国产硬件生态。目前JDet已经支持9个发表于CVPR、ICCV、TPAMI等顶级期刊会议的模型,被国内多家科研国防单位所使用的。基于JDet,选手可以方便地参加比赛,对模型进行训练、调优和改进。

 

三、数据集说明     

比赛使用的数据集FAIR1M-1.5由中国科学院空天信息创新研究院提供。

每组数据包含一张遥感图像以及与这张遥感图像对应的标注数据,包含遥感图像中物体的旋转包围盒及其物体类型,物体类型包括:Airplane、Ship、Vehicle、Basketball_Court、Tennis_Court、Football_field、Baseball_field、Intersection、Roundabout、Bridge。

标注数据存放在xml文件中,其中x.xml中存放了训练集图像x.tif标注数据的json文本,objects字段中存放了不同物体的标注信息,每个物体的标注信息包含possibleresult字段,存放物体分类名称;points字段,存放五个点,其中第一个和第五个点相同,表示一个四边形,对应这个物体的旋转包围盒,每个点的坐标由两个浮点数(x, y)表示,分别代表该点的像素列数和像素行数。

数据集分为训练集(5000张)、初赛测试集(576张)和决赛测试集(577张)三个部分,根据赛程与不同阶段公布,其中测试集只会公布图像而不会公布标注数据。

 

四、评测标准

本赛题将以mean Average Precision (mAP) VOC2012作为遥感图像目标检测结果的评测指标, 其中mAP的计算方式参考自Pascal VOC 2012 Challenge。

 

五、结果提交

公告

由于前次更新的初赛测试集存在质量问题,现对初赛测试集进行了更新,请各位选手使用更新后的测试集数据对自己的模型重新在初赛A榜进行测试并提交结果。更新后的测试集数据可在"数据集"页面中下载。初赛成绩以本次更新后测试集(576张)上的成绩为准。

 

【初赛pre-A榜】

暂停提交结果

【初赛A榜】

提交格式:提交测试集的结果CSV文件

提交次数:每天2次

开始提交时间:9月22日22:00

提交内容

  • 所有测试图像的检测结果输出到一个CSV文件中,每一行包含一个所检测到物体的信息:

  • 图像名称,类别名,x1,y1,x2,y2,x3,y3,x4,y4,置信度

  • 其中x表示像素的列数,y表示像素的行数,四个点组成的四边形表示所检测到的物体的旋转包围盒。类别名请按如下格式输出:Airplane, Ship, Vehicle, Basketball_Court, Tennis_Court, Football_Field, Baseball_Field, Intersection, Roundabout, Bridge

示例CSV文件内容如下:

4647.tif,Vehicle,10,10,20,10,20,20,10,20,0.80
5010.tif,Vehicle,30,30,40,30,40,40,30,40,0.82
5010.tif,Ship,100,100,200,100,200,200,100,200,0.95
1736.tif,Airplane,10,10,20,10,20,20,10,20,0.75

【初赛B榜】

提交格式:zip包(将所有文件上传至网盘,将网盘链接写进txt文件,打包成zip包进行提交)

提交内容:

1. Docker文件(含运行环境、代码、模型权重等,应能根据实验报告说明复现推理及训练过程)
2. 实验报告(含推理及训练复现方式说明、额外数据获取方式及处理方式、预训练模型获取或训练方式说明等)
如有必要,参赛者需配合主办方完成代码复现

提交次数:1次

初赛B榜审核群:扫码添加极市小助手极小新企业微信进入初赛B榜审核群

 

【决赛A榜】同初赛A榜

【决赛B榜同初赛B榜