2023年第二届“钉钉杯”大学生大数据挑战赛常见问题解答
一、报名相关
1.如何报名?
答:全国各参赛队伍或负责人登录钉钉杯大学生大数据挑战赛官方网站:http://www.nmmcm.org.cn/match_detail/27进行注册报名。
每支参赛队伍需缴纳参赛费用100元人民币,参赛队伍可以单独报名缴费,也可以通过学校组织(社团、老师)集体进行缴费,系统将为每个报名队伍独立配发参赛队伍号,例如 202301001001,忘记队伍号码,可在报名管理中查看或联系组委会工作人员进行解决。
2.报名截止时间是什么时候?
答:报名截止时间是2023年7月15日06:00(周五),提前报名,提前备赛。
3.报名需要哪些信息?
答:
(1)指导老师基本信息,包括:指导老师邮箱、指导老师姓名、指导老师电话(没有指导老师可不填写)。
(2)队员基本信息,包括:真实姓名、学校、手机号码和邮箱、证书邮寄地址。
4.有关组队人数、跨校组队问题?
答:每支参赛队伍成员上限为3人,允许跨校组队。竞赛允许跨校组队参加,没有专业限制,只要是在校本科生、专科生、研究生,不限专业,不限组别,无论参加什么组别都可以选择两道题中任意一道参赛。如果要组队的话,只需要队伍一个负责人报名缴费即可,也可以先报名缴费,然后再邀请别人加入自己的队伍。
5.报名信息必须都是中文吗?
答:钉钉杯为中文形式,所有页面出现的信息均填写中文形式填写,因为涉及到跨校问题,每名队员的学校名称和证书邮寄地址等信息务必准确填写。
6.报名缴费后因特殊情况需要更换队长/队员信息,应该怎么办?
答:所有参赛信息,开赛前如果需要更换队员、学校等信息,可直接官网自行修改或请及时联系钉钉杯竞赛组委会工作人员处理。
7.如果是想集体组织报名,该怎么报名?
答:集体报名的高校负责人须下载2023年第二届“钉钉杯”大学生大数据挑战赛集体报名登记表统一填写报名信息(注意:每支参赛队不需要在竞赛官网填写报名信息及缴费的操作)。统一填写好集体报名表后,同集体报名支付截图统一发至钉钉杯报名工作组邮箱(fw@nmmcm.org.cn),格式要求:学校+队伍数+支付人姓名。
需要集体报名没有表的找工作人员(竞赛咨询QQ:1532597773、1786746895)领取集体报名表。
8.报名后竞赛主页显示的报名编号(参赛队伍号)有什么用?
答:参赛队伍号是后续参赛写论文及提交论文用到的队伍号就是这个。
9.报完名以后电子档状态未提交是什么意思?
答:这里的电子档状态是比赛提交论文的状态标识,比赛期间提交论文之后,该状态会更新,比赛开始后,该状态旁边会开放提交论文入口。
二、竞赛相关
1.请问钉钉杯这个比赛是什么级别性质的?获奖证书章盖什么章?
答:一般认定为国赛,属于国家级竞赛,但不同的学校认定标准不同,具体情况请咨询自己学校的相关负责老师。
证书盖内蒙古创新教育学会、内蒙古基础教育研究院、钉钉(中国)信息技术有限公司三个章,在国内高校中是作为保研、综合测评、创新奖学金等评定竞赛之一,也可以丰富简历,面试直通车、大厂offer的敲门砖。
钉钉(Ding Talk)是阿里巴巴集团打造的企业级智能移动办公平台,是数字经济时代的企业组织协同办公和应用开发平台,钉钉是本届竞赛的联合举办单位。
2.钉钉杯赛题是什么类型的?和数学建模竞赛有什么区别?
答:赛题方向为数据分析和数据挖掘,题目来自国内大数据资深专家、企事业单位实际应用场景应用题目;大数据竞赛和数学建模,作为数据科学领域的两个重要分支,在解决实际问题方面发挥着关键作用。数学建模是将现实问题抽象为数学模型,利用数学方法分析和求解。
而大数据竞赛更注重通过大规模数据和相关工具进行数据分析、预测和决策。钉钉杯和传统大数据相比,难度适中,适合各种基础的学生学习提高。
另外,数学建模竞赛,每年都会出现数据分析和数据挖掘题型,和数学建模竞赛衔接较大,有数学建模基础更容易上手。
3.钉钉杯大数据竞赛基本流程是怎样的?
答:常规线路一般是:数据清洗 -> 特征挖掘/特征工程 -> 搭建模型 -> 训练模型 -> 给出预测 -> 提交论文及结果
4.参加钉钉杯大数据竞赛需要掌握哪些必备知识或技能?
答:
(1)包括数据预处理、特征工程、机器学习、深度学习等方面的知识和实践经验。
(2)大数据竞赛最常用的七种模型:XGBoost、LightGBM、CatBoost、SVR、MLP+Embedding、Tabnet和Transformer。
(3)竞赛常用的工具:
1.0Numpy | 必用的科学计算基础包,底层由C实现,计算速度快。
2.Pandas | 提供了高性能、易用的数据结构及数据分析工具。
3.NLTK | 自然语言工具包,集成了很多自然语言相关的算法和资源。
4.Stanford CoreNLP | Stanford的自然语言工具包,可以通过NLTK调用。
5.Gensim | 主题模型工具包,可用于训练词向量,读取预训练好的词向量。
6.scikit-learn | 机器学习Python包 ,包含了大部分的机器学习算法。
7.XGBoost/LightGBM | Gradient Boosting 算法的两种实现框架。
8.PyTorch/TensorFlow/Keras | 常用的深度学习框架。
9.StackNet | 准备好特征之后,可以直接使用的Stacking工具包。
10.Hyperopt | 通用的优化框架,可用于调参。
5.报名比赛后如何准备比赛?
答:大赛官网及参赛群文件里可参考历年真题、优秀论文、训练题目及答案进行学习。
组委会也为报名同学准备了赛前培训课程及公益讲座等培训学习资料,适合0基础的同学进行系统学习,所有参赛选手(队长)凭参赛队伍号赛前均可统一添加钉钉杯组委会:13948716615(微信号)免费开通赛前集训营,添加时备注:赛前培训资料。报名成功后就可以尽快投入到学习中了。
6.获奖比例是怎么算的?未进入复赛能获奖吗?
答:没有进入复赛的队伍,也会根据初赛成绩排名,颁发一等奖、二等奖、三等奖和优秀奖若干名。
复赛选取初赛中前15%获奖选手将晋级,颁发一等奖、二等奖、三等奖。
复赛中选取排名前10支队伍进行决赛答辩,最终奖项答辩总排名设为冠军,亚军,季军。
7.如何下载赛题及数据?
答:7月15日09:00开放初赛试题的下载,选手可以从竞赛官网、钉钉杯参赛群、数模乐园微信公众号、等相关渠道下载赛题及数据集。
8.初赛时长是多久呢?
答:初赛时间是7月15日09:00−7月23日09:00,为了让大家避开假期其他事项,假期中也有充足的时间进行比赛;另一方面是因确保比赛数据的严谨性,赛题数据量较大,需要多一些的时间去做题。
9.其他说明。
答:本项比赛全程不允许使用外部数据集。
三、关于发票
1. 如何获取发票?
答:
1.请将发票信息发送至邮箱:fw@nmmcm.org.cn;
2.发票申请最晚截止时间2023年12月末
3.文件命名格式:队伍号+队长姓名;
注意:若不知道自己队伍的纳税人识别号就找自己的老师要。集体报名和个人形式都可以提供发票;竞赛发票联系QQ:451583684
四、提交相关
1.参赛作品提交方式是什么样的?最终提交那几项内容?
答:
(1)作品在报名官网或邮件形式提交进行提交,必须在7月23日09:00之前提交完毕,会以最后一次提交的作品为准。
(2)最终提交的内容包含:参赛作品、结果、源代码等相关材料,详见竞赛提交流程说明。
2.提交文件大小有限制吗?
答:考虑实际使用,我们希望参赛选手使用的模型是简单而高效的,不鼓励使用超大模型,具体可查看竞赛提交流程说明。
3.本次大赛是否设置排行榜?如果没有排行榜,怎么验证自己模型的合理性呢?
答:本次竞赛不设置排行榜
(1)第一可以看准确率。
(2)第二就是设置一个验证题,从验证题里看模型效果,机器学习常用方法,就是训练集分两部分,一部分用于训练,一部分用于验证。
五、证书问题
1.获奖证书如何分发?
2.团队参赛的话,证书如何发放?
答:队内每位队员都会颁发一份纸质证书,证书上每名参赛队员都会有第一作者及自己的学校名称。(跨校队员也是如此)