第三届“慧源共享”全国高校开放数据创新研究大赛
1.大赛简介
为推动和促进教育科研领域数据资源的汇聚流通和共享开放,鼓励高校师生利用新技术对开放数据进行创新研究与应用,聚合各行业力量培养和提升大学生的数据素养,在上海市教育委员会、上海市经济和信息化委员会的指导与支持下,复旦大学图书馆、上海市教育委员会信息中心和上海市科研领域大数据联合创新实验室联合国内多家高校和企业,面向全国高校师生举办第三届“慧源共享”全国高校开放数据创新研究大赛系列活动。大赛同步启动4个分赛区(安徽分赛区、江苏分赛区、山东分赛区、浙江分赛区),另设1个分赛道(金融大数据知识与案例分析竞赛分赛道),充分发挥地方优势和专业特色,多维度、全方位促进大赛目标实现。
系列活动拟于2021年4月至10月开展:
图 1 大赛系列活动组织部分
第一部分:“数据悦读”学术训练营(4月23日~6月18日)
训练营面向全国高校师生,邀请不同行业、不同领域的数据科学家,围绕A(AI 工智能)、B(Blockchain 区块链)、C(Cloud Computing 云计算)、D(Big Data 大数据)、E(Energy Data 能源数据)、F(Fintech 金融科技)、G(GIS 地理信息)七大主题,在全国多所高校举行巡回讲座,并进行在线直播,形成数据素养系列课程。
第二部分:数据竞赛(4月23日~10月中旬)
主赛道:大赛提供来自政府、高校、企业的海量高价值数据资源。参赛团队可自定选题开展研究,以研究论文+论文海报+数据文档(以上为必交内容)+应用作品(选交内容)的形式参与竞赛。主赛道另设安徽、江苏、山东、浙江四个分赛区。
分赛道(金融大数据知识与案例分析竞赛):初赛为在线金融知识测试,复赛内容为金融大数据案例分析,决赛进行案例分析路演模拟。
第三部分:成果孵化(10月下旬起)
通过出版大赛优秀论文集、推荐发表优秀获奖论文、推荐出版优秀数据、支持优秀成果落地转化、推荐实习等途径,为参赛团队提供更多机会和支持。
大赛系列活动于2021年4月23日正式启动,欢迎全国高校师生密切关注并积极参加。详情敬请关注大赛网(http://www.huiyuan.sh.edu.cn/competition/#/home)和微信公众号“慧源共享”(微信号:huiyuansharing)。
2.大赛规则
2.1 概述
本届大赛设主赛道和分赛道,参赛师生可根据规则要求同时报名两个赛道,或参加其中一个赛道,分赛道规则详见http://www.sef.shisu.edu.cn/。
大赛主赛道在全国赛区基础上设安徽分赛区、江苏分赛区、山东分赛区、浙江分赛区,分赛区评选规则和奖项设置等详见各分赛区要求。
参赛队伍根据队长报名时身份归属(即所属学校)确定分赛区。例如,张同学目前就读于浙江大学,作为参赛队长,其所在团队提交的作品可参加浙江分赛区和全国赛区的评选,有机会分别获得分赛区奖项和全国赛区奖项;王同学目前就读于兰州大学, 作为参赛队长,其所在团队提交作品可参加全国赛区的评选,竞争全国赛区奖项。
2.2 参赛对象
全国高校、研究生院(所)在校师生。具体要求如下:
2.3 参赛要求
2.3.1 总体要求
参赛团队须基于数据(大赛数据/自有数据)开展研究,完成竞赛作品。
参赛作品题目自拟(可参考大赛提供的选题指南),鼓励围绕城市数字化转型等热点问题开展研究。
参赛作品应为未经发表的原创作品,具有一定的创新性和独特性,最终提交作品包括以下内容:
图 2 提交作品要求
参赛作品要求清楚注明团队信息,明确作者排序。
入围决赛的团队,要求参加专家答辩(具体线上/线下形式视疫情防控要求而定)。
所有参赛相关的提交材料均不予退还。主办方有权将参赛作品及相关信息用于制作纸质、音频、视频等形式的宣传品和出版物(传播途径包括互联网),以及举办展览展示活动(展览展示途径包括互联网)等。
2.3.2 数据要求
参赛团队可基于大赛数据或者自有数据,基于以下任一方式完成竞赛作品。
图 3 数据使用方式
具体数据要求如下:
(1)大赛数据。
大赛数据,即大赛数据支持单位提供的所有数据,详见官网大赛数据部分(https://www.huiyuan.sh.edu.cn/competition/#/data)。
参赛团队报名成功后,可提交研究设想申请获取相关数据集。大赛组委会及数据支持单位将根据具体情况对参赛团队进行身份验证、数据申请审核、数据使用协议审核等。
(2)自有数据。
自有数据,指参赛团队以研究为目的,自行采集、清洗、整理的无版权问题的研究数据。举例说明,以下类型数据可视为自有数据:①为研究微博用户行为而依法收集的微博博文数据;②为研究科研人员数据共享意识,自行设计问卷并收集的调查问卷数据。
参赛团队须在4月23日至5月31日期间将自有数据上传至慧源科学数据平台,大赛组委会审核发布后方可用于参赛作品。上传的自有数据须包括数据集和《数据集基本信息文档》,说明数据采集方法、数据清洗流程、数据字典、数据使用建议等内容。自有数据应遵循慧源科学数据平台的数据政策。提交自有数据的参赛团队默认同意将数据用于大赛范围内的共享,供其他参赛团队使用。
2.3.3 研究论文要求
竞赛论文应基于数据进行研究,根据具体的研究主题,阐述研究意义、研究问题、数据分析、研究结论和应用成果等内容。
论文字数 5000~12000 字。
论文格式应遵循第三届“慧源共享”全国高校开放数据创新研究大赛-论文模板的要求。
2.3.4论文海报要求
海报内容应与研究论文相一致,每个作品限1页海报。
海报中包括论文题目、研究问题、研究思路与方法、研究结论等必要信息。
大赛提供海报模板,在基于模板制作海报时,除与文章有关的内容可按规范制作外,其他大赛活动图标文字均不得变动。
海报不宜太多文字,应遵循文字和图表相结合的原则,列出关键图,合理排版,整个海报的文字图表覆盖率要求在90%以上,结尾不要留有大片空白。
海报大小为 90cm(竖向高度)*60cm(横向宽度),分辨率为150dpi。
2.3.5数据文档要求
参赛团队须根据数据核查清单提交相应的数据文档。
要求根据数据文档可复现参赛团队的研究成果。
数据核查清单包括:
一份自述文件(.docx格式)。
分析数据集(将大赛数据或自有数据进行预处理后直接用于分析与研究的数据集)。
一份 Codebook(.xlsx格式)。(分析数据集的说明文档)
命令文件和工具(复现研究结果所需,如Stata.do文件和R包等)。
2.3.6应用作品要求
应用作品包括移动应用、网站和可视化作品,不限形式,微信小程序、微站(移动Web应用)或iOS、Android等平台上的App、网站、利用第三方工具制作的可视化作品等等均可。
如提交应用,应同时提交作品说明文档,涵盖如下部分:
整体介绍:介绍作品的概况,准确描述作品的立意和应用场景,针对受众群体的问题和需求,综合运用数据集和各类数据技术,提供相应的解决方案或有价值的分析结论。
数据使用:说明所使用的大赛数据和自有数据,数据的融合运用方式和挖掘利用程度。
作品自评:说明作品的创新性、交互性、美观性、采纳的技术、凸显的价值和意义等。
2.4 大赛评审
表 1 大赛评审规则
评审阶段 | 评审方式 |
形式审查 | 对提交作品进行形式审核,包括是否按要求提交了研究论文、论文海报、数据文档以及应用作品(如有);论文书写是否规范,是否遵循了大赛指定模板;论文海报是否使用了大赛海报模板;研究是否使用了大赛要求的数据;大赛论文是否通过查重检测等。 |
专家盲审 | 组织相关领域专家,对提交作品的内容进行盲审。评价标准主要包括成果的创新性、算法模型的效果、数据的利用程度、作品的社会效益和商业价值等。 |
作品答辩 | 根据专家打分,共计15项作品进入答辩环节(排位赛)。作品答辩后确定特等奖、一等奖、二等奖、三等奖。如不能参加答辩,则视为放弃比赛资格。 |
注:分赛道/赛区评审规则详见相关赛事要求。
2.5 大赛组委会权利
大赛组委会保留拒绝任何参赛个人或组织参赛的权利,并保留拒绝接受参赛作品的权利。
有以下情况的,大赛主办方有权取消参赛者参赛资格:
违反中华人民共和国相关法律法规;
涉嫌作弊行为,或侵犯他人知识产权;
涉嫌散布,或采用虚假信息;
提交的作品包含不健康、淫秽、色情的内容;
提交的作品包含侮辱、诽谤任何第三方的内容;
提交的作品包含其他主办方认为不适当的内容。
大赛组委会保留修改报名时间、比赛作品提交截止时间、评审和颁奖等活动日期的权利;大赛组委会有权随时暂停或终止比赛。
大赛组委会保留调整比赛各阶段入选团队数量的权利(包含决赛),以及调整奖项设置的权利。
大赛组委会保留收回或拒绝授予某个特定团队奖项的权利。
大赛组委会保留对该大赛规则修订的权利,并拥有对大赛规则的最终解释权。
大赛组委会有权对参赛作品汇集成册,通过多种方式展示和宣传,并组织出版和推荐发表。
大赛规则最终解释权归主办方所有。
3.赛事日程
评审阶段 | 评审方式 |
4月23日~6月18日 | “数据悦读”学术训练营 |
4月23日~6月18日 | 主赛道报名 |
4月23日~6月28日 | 提交研究设想,申请相关数据 |
7月10日~9月上旬 | 作品提交 |
9月中下旬~10月中旬 | 作品评审(初审、复审、答辩) |
10月下旬起 | 成果孵化 |
4.大赛数据
4.1 数据开放办法
大赛提供来自政府、高校、企业的海量高价值数据资源。4月23日至5月31日期间大赛官网将持续更新数据信息,参赛队伍可先下载查看大赛样本数据集(http://data.huiyuan.sh.edu.cn/data/dv/HuiyuanSharingDataCompetition2021/faces/study/StudyPage.xhtml?globalId=hdl:20.500.12291/10682),了解并申请相关数据。
大赛数据按照数据提供方的要求均须申请获取。参赛队伍登录大赛官网,根据提示完成身份验证、提交研究设想、申请数据并提交数据使用协议。大赛组委会将在7-10个工作日内反馈数据申请情况。
表 2 数据申请步骤
申请步骤 | 详情 |
身份验证 | 大赛组委会审核参赛团队所有成员的校园一卡通信息,查验在校身份。 |
提交研究设想 | 参赛团队提交其研究设想,包括论文选题、研究概述、计划安排和预期应用成果(选填)。 |
申请数据 | 参赛团队根据研究需要选择要申请的数据,须确保选择的数据和研究设想相匹配,否则会影响数据申请的结果。 原则上每支参赛队伍有1次申请数据的机会。但若参赛队伍在4.23-5.31期间申请数据并审核通过后,在6.1-6.28期间还有1次补充申请数据的机会。 |
提交数据使用协议 | 参赛团队所有成员均须仔细阅读数据使用协议的各项内容,并在协议上签字。 |
5.奖项设置
大赛系列活动总奖金池超过10万元人民币。
主赛道全国奖项设置:
奖项 | 数量 | 金额 | 奖励方式 |
特等奖 | 1 组 | ¥20,000/组 | 奖金或等值奖品,奖金均含税,纳税义务需由获奖者承担 |
一等奖 | 2 组 | ¥10,000/组 | |
二等奖 | 4 组 | ¥5,000/组 | |
三等奖 | 8 组 | ¥2,000/组 | |
优秀奖 | 若干 | ~ | 获奖证书 |
成功参赛 | ~ | 参赛证书 | |
优秀指导教师 | 若干(特等奖、一二三等奖、 优秀奖团队指导教师) | 获奖证书 | |
优秀组织奖 | 若干 | 获奖证书 |
更多机会:专业实习、学术出版、成果孵化...
6.组织单位
主办单位:复旦大学图书馆、上海市教育委员会信息中心
联合主办:安徽大学图书馆、南京大学图书馆、山东大学图书馆、上海外国语大学国际金融贸易学院、浙江大学图书馆
承办单位:上海市科研领域大数据联合创新实验室
联合承办:北京万方数据股份有限公司、上海阿法迪智能数字科技股份有限公司
协办单位:安徽省高校图工委、重庆市高校图工委、江苏省高校图工委、教育部CADAL项目管理中心、清华大学图书馆、上海市高校图工委、山东省高校图工委、四川省高校图工委、武汉大学图书馆、浙江省高校图工委
数据支持单位:安徽大学图书馆、北京理工大学图书馆、北京万方数据股份有限公司、 重庆大学图书馆、东华大学图书馆、复旦大学当代中国社会生活资料中心、复旦大学社会科学数据研究中心、复旦大学图书馆、国家卫生健康委流动人口服务中心、教育部CADAL项目管理中心、南京大学图书馆、山东大学图书馆、山东农业大学图书馆、山东师范大学图书馆、上海财经大学图书馆、上海大学图书馆、上海电力大学图书馆、上海海洋大学图书馆、上海理工大学图书馆、上海青年管理干部学院、上海师范大学图书馆、上海市电化教育馆、上海市各相关部门、上海外国语大学图书馆、同济大学图书馆、浙江大学图书馆、中国工程院中国工程科技知识中心、中国海洋大学图书馆、中国石油大学(华东)图书馆等
学术合作伙伴:复旦大学出版社、《图书馆杂志》社
媒体合作伙伴:DT财经、造就
支持合作伙伴:北京万方数据股份有限公司、上海阿法迪智能数字科技股份有限公司、上海市大数据股份有限公司、上海韬视信息技术有限公司、上海云教信息技术有限公司
7.联系方式
感谢您对本次活动的关注与支持!期待您的参与!
如您对本次活动有任何疑问,欢迎通过以下方式联系我们:
主赛道联系人:伏老师
邮箱:ihssd@fudan.edu.cn电话:021-65642106
分赛道联系人:罗老师
邮箱:luoguangsheng03@126.com 电话:18916703239