导航

2023全国大数据与计算智能挑战赛通知

发布者:谢倩发布时间:2023-05-19浏览次数:1245

全国大数据与计算智能挑战赛是由国防科技大学系统工程学院大数据与决策实验室组织的年度赛事活动,旨在深入挖掘大数据应用实践中亟需破解的能力生成难题、选拔汇聚数据领域优势团队、促进大数据领域的技术创新和面向需求的成果生成、推动形成集智众筹、联合攻关、共享共用的研建用一体迭代演进创新模式。

2023全国大数据与计算智能挑战赛以发榜挑战、集智攻关为主题,面向全国大数据与计算智能领域的相关单位,围绕自然语言处理、图像检测识别、时空数据分析、知识建模分析等前沿技术难点开设赛道,以揭榜打擂的形式组织创研竞赛,通过线上打榜与现场评审相结合的方式决出优势团队。

一、组织单位

国防科技大学系统工程学院(大数据与决策实验室)

二、赛题汇总

赛题1Data-To-Text 硬约束下的受控文本生成

赛题链接:https://www.datafountain.cn/competitions/633

赛题任务:设计给定关键词的文本生成技术攻关和给定表格的文本生成技术攻关2个课题,难度递增。初赛要求在一组给定顺序的关键词的情况下,生成一段包含所有关键词的文本,生成文本需要具有领域相关性和表达流畅性。复赛要求在给定一个表格的情况下,生成一段包含表格关键信息的文本,生成文本必须忠实于表格,且满足语法使用正确、表达简洁清晰、语义自然连贯的要求。

赛题2:多粒度时序知识图谱问答

赛题链接:https://www.datafountain.cn/competitions/634

赛题任务:以四元组的形式给定一个时序知识图谱,其格式为[头实体 关系 尾实体 时间]。对于给定的每一个自然语言问题,参赛者需要依据时序知识图谱中的信息进行推理与回答。问题中涉及多种粒度的时间信息,以及多种类型的时间约束条件。

赛题3:基于高分辨率遥感可见光数据的细粒度密集船只目标检测任务

赛题链接:https://www.datafountain.cn/competitions/635

赛题任务:基于高分辨率遥感可见光数据的细粒度密集船只目标检测任务要求对船只目标进行定位,并对船只进行型号识别。遥感场景中,细粒度船只类间差距极小、船只分布密集、船只尺度变化大,如何使用检测方法实现高精度细粒度船只识别是本赛题的研究难点。

赛题4:基于传感器信号的航迹实时关联与轨迹融合任务

赛题链接:https://www.datafountain.cn/competitions/636

赛题任务:赛题提供多个多源传感器(2D雷达与ESM传感器)的实时数据,要求参赛者设计合适的模型以辨别不同舰船目标、识别特殊目标以及实时获取舰船经纬度信息,并对同一舰船的轨迹进行融合。同时,需要保证模型的精度与泛化能力。

赛题5:基于亚米级影像的精细化目标检测

赛题链接:https://www.datafountain.cn/competitions/637

赛题任务:本任务属于目标检测领域中的精细化检测识别问题,不同于普通的图像检测识别任务,精细化检测识别任务的类间差异更小,其目的是定位并识别出常规目标中的子类。该任务对于目标检测识别的要求更高,难度更大,同时具有真实场景下广泛的应用价值。

赛题6:领域多事件信息联合抽取

赛题链接:https://www.datafountain.cn/competitions/638

赛题任务:本次竞赛构建领域新闻篇章级事件抽取数据集(FNDEE)并基于该数据集发布领域多事件信息联合抽取挑战,要求基于篇章级文本尽可能独立、完整、准确地抽取多个事件,包括事件的触发词、事件类型、论元及论元角色。此外,为更好地探索抽取出的多事件之间的关联,本次赛题定义交织论元并鼓励关注交织论元的抽取,交织论元即为同一段文本中属于多个不同事件的论元,要求完整抽取隶属于不同的事件并扮演多种论元角色的交织论元。

赛题7:面向低资源和增量类型的命名实体识别

赛题链接:https://www.datafountain.cn/competitions/639

赛题任务:初赛任务为低资源命名实体识别,即给定一个低资源训练集,其中每种实体类型仅涉及50个左右的样本案例,参赛者需要训练一个命名实体识别模型,使其能在规模更大的测试集上取得较好的性能。复赛任务为持续命名实体识别,参赛者需要设计一个系统化的模型,使其能够连续地学习一个实体识别任务序列,其中每个任务拥有独立的数据集,并且每个任务仅涉及一个实体类型。

赛题8:数据集隐私求交技术

赛题链接:https://www.datafountain.cn/competitions/640

赛题任务:本赛题要求参赛者实现隐私求交技术的应用功能。主办方提供4个数据样本,参与方通过隐私求交的算法计算得到两个数据集配对的交集,在整个计算过程中,不能暴露数据样本的原始数据,并且计算结果仅接收方可知。

三、赛事安排

大赛赛程共计四个月,采用初赛、复赛、决赛的三级赛制,具体赛程安排如下:

初赛阶段

20230505日,发布大赛赛题,选手可登录大赛官网报名;

20230512日,各赛题陆续开放数据下载和作品提交功能,进行第一轮评测;

20230625日(12:00),截止报名组队及团队信息修改;

20230628日(24:00),截止初赛作品提交,每道赛题遴选决出前30支团队(各赛题数量不同)入围复赛。

复赛阶段

20230630日—0713日,入围复赛的团队进行第二轮评测,根据赛题设线上和线下(国防科技大学系统工程学院)两个赛道进行;

202307月中下旬,反作弊审核,作品成绩复现,每道赛题遴选决出5支团队入围决赛。

决赛阶段

202308月,组织线下专家评审,入围决赛团队现场答辩。适时公布优胜队伍,组织颁奖。

特别提醒:

不同赛题分别对应不同的细分赛程,详情请移步大赛官网相应赛题页查看。

大赛官网:https://www.datafountain.cn/special/BDSSF

科学技术处

2023年5月18日