通知 Notice
2024年第三届钉钉杯大数据挑战赛参赛规则
来源:
发布于:2024-06-06
浏览量:481
分享

2024年第三届钉钉杯大数据挑战赛参赛规则

 

为鼓励大学生踊跃开拓知识面,培养学生的创新思维和合作精神,内蒙古创新教育学会、内蒙古基础教育研究院以及钉钉(中国)信息技术有限公司联合举办2024年第三届“钉钉杯”大学生大数据挑战赛。

竞赛已成功举办两届,竞赛的参与学校、参赛队伍、参赛人数不断攀升、屡创新高。截止目参赛高校已达到512多所,累计参赛人数万人以上。往届参赛高校覆盖复旦大学、华中科技大学、天津大学、上海交通大学等高校。除中国大陆高校外,同时吸引来自澳大利亚悉尼大学等境外高校参赛。
   钉钉杯大数据竞赛发展至今已被众多所高校纳入学科认定赛事,成为继kaggle、天池大数据竞赛之后的又一项全国性数据科学竞赛,且得到高校以及知名企业的高度认可和鼎力支持,竞赛可作为学生评奖评优、综测加分、大厂offer、实习机会&高薪就业、数据分析与数据挖掘实战项目等提供有效帮助。

欢迎各院校按照钉钉杯大学生大数据挑战赛章程、参赛规则及有关规定组织同学报名参赛。

一、主办单位

主办单位:内蒙古创新教育学会、内蒙古基础教育研究院

赞助单位:钉钉(中国)信息技术有限公司

、竞赛时间

报名时间:即日起至2024年7月26日06:00(周五)

1.初赛:(7月26日09:00-8月1日09:00)

参赛选手需要按照赛题要求将模型预测结果保存为CSV文件,交到大数据竞赛平台平台使用测试集数据检验参赛者模型泛化能力并在大赛网站上公布模型优劣排名,并撰写报告与最终提交

此外,还需要遵守提交时间、文件大小和提交次数等限制,提前做好规划和时间安排。选手可在线提交结果文件至竞赛平台,每日每队最多可提交3次,提交时系统验证提交数据格式是否正确;

初赛成绩不会影响复赛成绩;

最终初赛成绩中前15%获奖选手将晋级复赛;

2.复赛(8月28日09:00-9月2日09:00)

复赛为统一命题,不更换题目背景,但可能会更换题目问题和数据,参赛流程与初赛一致。

3.决赛(10月中旬)

复赛中综合总排名前10的队伍进入答辩环节,答辩采用线上或者线下的方式进行。答辩决出冠军1支队伍、亚军2支队伍、季军3支队伍(不分组别,不分赛题)。

决赛将以线上答辩会的形式进行,晋级决赛团队需提前准备答辩材料,包括答辩 PPT、参赛总结、算法核心代码。

答辩现场,每支队伍面对评委有15分钟的陈述时间和10分钟的问答时间。评委将根据选手的技术思路、理论深度和现场表现进行综合评分。

决赛分数将根据参赛队伍的论文成绩和答辩成绩加权得出,评分权重为复赛阶段70%,决赛答辩30%。

决赛时间安排另行通知。

、参赛流程

赛前须知

1) 大赛面向在校大学生(包括高职高专、本科、研究生),可以单人参赛或自由组队,每个参赛队伍人数最多不超过3人,允许跨年级、跨专业、跨校组队。

2) 每人只能参加一支队伍(即个人参赛后不可再与他人组队参赛,或个人参加一个队伍后不可再参加另一个队伍),允许最多有一名指导老师,指导教师须为在职大学生教师。

3) 参赛组别的确定依据是团队成员中的最高在读学历。

4) 赛前阅读竞赛的官方说明、规则和评审标准

5) 理解竞赛的目标、数据集和评价指标

注册报名

1) 全国各参赛队伍须在注册截止时间2024年7月26日06:00(周五)前完成报名工作;在线报名官网:http://www.nmmcm.org.cn/match_detail/33

a.报名官网,点击位于屏幕右侧的立即报名,正确填写队伍信息进行注册报;注意:报名截止后将不能再更改报名信息,确保使用的是当前有效的电子邮件地址以便我们在竞赛前、中、后必要的时候可以联系到你。

b.如果你是学校集体报名的,请学校集体报名负责人,与竞赛工作人员联系。

2) 注册费

参赛高需为每个参赛队伍缴纳100元参赛费通过大赛官网缴纳;费用用于大赛组织、命题、评审等工作。

3) 个人报名通过报名官网缴费,集体报名的高校负责人须下载2024年第三届钉钉杯大学生大数据挑战赛集体报名登记表(https://kdocs.cn/l/cq5hmvflre5y)统一填写报名信息 (注意:每支参赛队不需要在钉钉杯报名官网填写报名信息及缴费的操作)。统一填写好集体报名表后同集体报名支付截图统一发至邮箱 (fw@nmmcm.org.cn),格式要求:学校+队伍数+支付人姓名。个人通过报名网站报名完成后即可得到参赛编号,集体报名的队伍,由工作人员审核后获得参赛编号。

4) 发票凭

开票式:开具增值税普通电子发票参赛队提供发票信息如下:学校全名称、纳识别号、地址、电话、开户行及账号注意若不知道自己队伍的纳税人识别号就己的老师要。如果需要发票做报销用,请发邮件至 fw@nmmcm.org.cn 索取。为保证务凭证顺利开具发票,请将转账汇款凭证放在附件中。注:钉钉杯赛开具的名称为:2024钉钉杯报名费

竞赛中

1) 选题

初赛、复赛分为研究生组、本科生组、专科生组,竞赛题目共2道(A题、B题)赛题方向为数据分析和数据挖掘,题目来自国内大数据资深专家、企事业单位实际应用场景应用题目提供了基于真实场景(经过脱敏处理)数据每个参赛队从个赛题中任选一题作答,竞赛题将在竞赛开始日准时发布,参赛队员可通过访问下面的网页获得竞赛题:http://www.nmmcm.org.cn/match_detail/33

初赛时间:(7月26日09:00-8月1日09:00)

下载对应赛题以及包括训练数据的任何相关数据理解数据格式和结构

2) 数据分析

对数据进行探索性分析,了解数据特征和分布

赛题提供的数据来自多个数据表格,需要进行数据预处理和清洗,以方便后续的特征工程、建模和评估。可以使用 Pandas 等库对数据进行读取、合并、过滤、填充、转换等操作。

清洗数据,处理缺失值、异常值和噪声等

进行特征工程,包括特征选择、特征提取和特征构造

3) 模型选择与训练

选择合适的机器学习算法或深度学习模型

划分训练集和验证集,进行交叉验证

训练模型,并调整模型参数(超参数调优)

选手应该了解各种算法的优缺点、适用场景和参数设置等信息,综合考虑模型的复杂度和泛化能力,并根据赛题评分标准选择最合适的模型。

在构建好模型之后,选手需要对模型进行训练和调优,以获得最佳的性能表现。可以使用交叉验证、网格搜索等技术进行模型选择和参数优化,同时要注意防止过拟合或欠拟合的情况。

4) 自我模型评估

使用验证集评估模型性能

根据评价指标(如准确率、召回率、F1 分数等)调整模型

5) 模型结果提交

按照竞赛要求规定的格式提交训练好的模型和模型定义文件参赛者以csv文件格式提交到大数据竞赛平台,平台使用测试集数据检验参赛者模型泛化能力并在大赛网站上公布模型优劣排名。

7月26日09:00-8月1日09:00时间内(初赛)选手可在线提交结果文件至竞赛平台,每日每队最多可提交3次此外,还需要遵守提交时间、文件大小和提交次数等限制,提前做好规划和时间安排。

6) 撰写报告与最终提交

8月1日09:00前(初赛),通过大赛官网提交一份详细的技术报告,描述使用的方法、实验结果和结论

提交最终的可读性高的可运行代码和模型参赛者将所需要的各类文档数据等全部材料

建议选手在参赛之前先阅读赛题说明、数据描述、评分标准等内容,对赛题有一个初步的了解和认识。

在比赛过程中,选手应该注意数据的质量、特征的重要性、模型的可解释性等问题,及时反馈和调整。

竞赛后

1) 等待评审

提交所有材料后,等待竞赛组委会评审

2)竞赛结果

竞赛结束后,组委会公布最终结果和排名

3)评审规定

参赛论文

根据问题,准备一份论文对项目进行说明,论文中的摘要部

分需要简明扼要地概述模型算法的核心思想以及效果,正文部分

需要详细阐述模型算法的细节、求解过程、结果以及对应的参考

文献。

项目完成度

与解决方案匹配的完整代码,可以是Python、Matlab、C++、 Java等语言的代码,附详细的操作说明文档和源代码。

模型泛化性能

未公开测试数据集验证得到的准确率、召回率等与题目实际背景密切相关的考核指标。

创新性

具有创新的系统分析和解题思路,创新的算法设计,跨学科交叉应用能力等。

4)奖项设置

初赛根据初赛成绩排名,颁发一等奖、二等奖、三等奖和优秀奖若干名

奖项名称

获奖比例

获奖证书

一等奖

5%

电子版获奖证书

二等奖

15%

电子版获奖证书

三等奖

30%

电子版获奖证书

优秀奖

若干名

电子版获奖证书

优秀指导老师

根据指导组织参赛队伍数量综合评定。

优秀组织单位

根据指导组织参赛队伍数量综合评定。

优秀志愿者

为竞赛的宣传,组织,分发获奖证书做出贡献。

复赛选取初赛中前15%获奖选手将晋级,颁发一等奖、二等奖、三等奖。

奖项名称

获奖比例

获奖证书

一等奖

5%

获奖证书

二等奖

10%

获奖证书

三等奖

15%

获奖证书

复赛中选取排名前10支队伍进行决赛答辩,最终奖项答辩总排名设为冠军,亚军,季军。具体奖项设置

奖项名称

获奖人数

获奖证书

奖金

冠军

1支

获奖证书

2000元

亚军

2支

获奖证书

1000元/每支

季军

3支

获奖证书

500元/每支

5)违规处理

参赛者应本着诚实、公平的态度参加比赛,如在以下情况出现违规,大赛组织委员会(简称“大赛组委会”)有权取消参赛者所在队伍的参赛资格,情节严重者将通报参赛者所在大学生并追究其违法责任。

账号使用:参赛者有义务保证账号信息的真实性和有效性,且账号仅限于参赛者本人使用;参赛者禁止使用多账号参赛,同一参赛者不可使用多个账号进行提交操作;如根据判断认为参赛 账号存在异常或违背正常使用条例,组委会可以单方面暂停或终止该账号登录大赛平台。

比赛成果:严禁参赛队伍之间相互抄袭。如不同参赛队伍提交结果高度相似,经判定存在抄袭行为的,组委会将取消相关参赛队伍的参赛资格,相关参赛成绩无效。另外,参赛者应保证其在比赛过程中所产出的所有成果未侵犯任何第三方的知识产权、商业秘密及其他合法权益。如第三方因为参赛者侵权行为提出索赔、诉讼等,参赛者应承担由此产生的全部责任及损失。

数据使用:对于大赛提供的数据(数据集),参赛者须仅在比赛场景下使用,同时不得以任何形式使用比赛之外的任何数据参赛。对于不提供下载的比赛数据,参赛者不得以任何形式擅自复制、下载或获取。参赛者如发现任何出现数据未授权访问的可能,应立即通知组委会并积极提供相关信息。

代码分享:在大赛举办期间,未经组委会同意,参赛者禁止公开分享与赛事相关的数据、模型和代码;大赛结束之后,参赛者可以在拥有模型和代码的知识产权的情况下自行选择公开分享,但需要确保此类公开共享不会侵犯任何第三方的知识产权、商业秘密及其他合法权益。

参赛者若在参赛过程中发现相关规则漏洞或技术漏洞,有义务及时告知资委会相关漏洞的信息,组委会将对提供相关信息的参赛者表示相关感谢;若参赛者利用相关漏洞进行参赛,经判断查证后,成绩将会被判断为无效成绩。

参赛团队需共同维护竞赛环境的公平公正,禁止在指定考核技术能力的范围外,利用规则漏洞或技术漏洞等不良途径提高成绩与排名,禁止在比赛中抄袭他人作品、交换答案、使用多个小号,一经发现将取消比赛成绩并严肃处理。

钉钉杯大数据竞赛基于自动化反作弊系统、结合人工审核,赛中动态反违规、反作弊,若收到团队封禁通知,可在指定页面申诉。

内蒙古创新教育学会

内蒙古基础教育研究院

钉钉(中国)信息技术有限公司

2024年6月


联系我们 CONTACT US

竞赛合作

范老师

手机:15661144116

QQ:2875393680

邮箱:2875393680@qq.com

邮编:010000

报名咨询

藏老师

手机:18947927578

QQ:3046361057

邮箱:3046361057@qq.com

邮编:010000

数维杯数学建模官网
蒙ICP备2023000922号