基于获奖数据的全国密码技术竞赛分析
时间:2023-04-08 08:05:06 来源:千叶帆 本文已影响人
刘 涛 马 慧 翁方宸 刘天威 伍高飞 王 鹤 李学俊 张玉清1,
1(西安电子科技大学网络与信息安全学院 西安 710126)2(海南大学网络空间安全学院(密码学院) 海口 570208)3(中国科学院大学国家计算机网络入侵防范中心 北京 101408)
全国密码技术竞赛自2015年创办以来,已成功举办了6届.从第1届的39家参赛单位共110个参赛队伍,到2021年第6届的60家参赛单位共333个参赛队伍参加,已成为目前国内密码领域级别最高、影响力最大的经典赛事.目前对竞赛相关的研究与分析主要分为3大类:一类是从竞赛组织者角度对竞赛本身的开展和实施进行总结[1-2],姚慧等人[3]基于模糊层次分析法对研究生竞赛项目进行量化分析并优选;一类是从竞赛参与者角度对人才培养的影响和作用进行探讨[4-6],戴鑫等人[7]采用专家访谈法和探索性因子分析法对1 291名大学生调查结果进行分析;
一类是从竞赛数据角度对其他因素的影响进行定类与定量的分析,Su等人[8]采用独立样本t检验分析性别、籍贯、参加比赛频率等影响大学生社会适应能力的因素.
基于以上分类和相关的文献调查,本文总结了目前竞赛分析类论文存在的不足:1)在视角上,现有文献大多基于某个参赛主体,缺乏从赛事整体、行业发展和举办方等视角来分析;
2)在方法上,现有文献大多采用问卷调查进行统计归纳,缺乏合理的数据分析方法;
3)在观点上,现有文献大多基于个体的现象和结果进行总结,缺乏坚实且广泛的数据支撑.针对上述不足,本文首次对全国密码技术竞赛进行深入的系统剖析,基于获奖数据,采用熵权法和TOPSIS综合评价法对历年获奖数据进行处理与分析,主要工作与贡献如下:
1) 基于熵权法,通过线性加权方式对历届参赛单位进行排名,对排名前3的参赛单位的作品和获奖情况进行统计,结合其在密码学相关领域的投入,剖析获奖原因;
2) 对官方6大类作品和A,B类命题的获奖作品进行整理,分析获奖作品分布情况,探究作品的选题分类和获奖情况之间的关系;
3) 对参赛作品领域进行细致分类,探索作品所选领域和方向对最终获奖的影响,先通过TOPSIS综合评价法对不同领域获奖作品进行分析,再基于作品简介进行深入分析,从中提炼出不同名次作品具备的特点.
1.1 数据收集
通过在全国密码技术竞赛官网和部分官方媒体的新闻报道中,收集了2015年第1届至2021年第6届的获奖数据,其中2020年由于疫情的原因竞赛没有举办.我们将收集到的数据进行了归纳整理.该竞赛在2015年第1届和2016年第2届时设置奖项为1等奖、2等奖、3等奖和优胜奖,自2017年第3届起更改奖项设置为特等奖、1等奖、2等奖、3等奖,并且以后的每届比赛一直延续了该奖项设置.因此,本文全篇研究选取了2017—2021年间近4届比赛的获奖情况作为分析的数据来源,具体数据如表1所示:
表1 2015—2021历年具体获奖数据
1.2 数据处理
1.2.1 处理方法
竞赛数据有着不同的特点,需要对应不同的数据处理方法.本文选取熵权法和TOPSIS综合评价法作为主要的数据处理方法.
1) 熵权法[9].在信息论中,熵是对不确定性的一种度量.信息量越大不确定性越小,熵越小,在综合评价中对结果的影响反而越大,对应有较大的权重.例如特等奖所占权重更大,基本算法步骤如下:
① 将各个奖项指标进行标准化处理.数据指标一般分为成本型、效应型和区间型等,对于本文数据应选取效应型指标,也就是指标值越大越好.将各奖项数据归一化到区间[0,1),假设给定i个奖项指标的数据x1,x2,…,xi,对于j学校的各个奖项指标数据标准化后,得到:
(1)
② 计算第i项指标下第j个学校占该指标的比重:
(2)
③ 根据信息熵的定义,1组数据的信息熵:
(3)
④ 根据信息熵的计算公式,计算各个指标的信息熵,进而得到各个指标的权重:
(4)
⑤ 根据权重计算综合得分:
(5)
2) TOPSIS综合评价法[10].即“逼近理想解排序方法”,是系统工程中常用的决策技术,主要用来解决有限方案多目标决策问题,是一种运用距离作为评价标准的综合评价法.通过计算各研究对象与最优方案、最劣方案的相对距离进行排序[11],其基本算法步骤如下:
① 构造原始数据矩阵A=(aij)10×16,其中aij表示某类作品在第i年获取奖项j的数目;
② 对原始数据进行预处理,为了消除单类作品获奖总数对整个评价系统的影响,将数据进行预处理,得到矩阵B=(bij)10×16,其中bij=aij/∑aik,k∈[1,2,…,j),bij为某类作品在当年获取某奖项的概率,ak为该领域在当年的获奖总数;
③ 构建加权矩阵C=(cij)10×16.利用权重W=[w1,w2,…,w16]T,进一步得到最终加权数据cij=wjbij;
1.2.2 处理过程
对收集到的2017—2021年4届比赛的获奖数据进行如下处理:
1) 统计各参赛单位历届获得特等奖、1等奖、2等奖、3等奖的数量.
2) 基于表1的获奖数据采用熵权法计算各奖项权重,如表2所示:
表2 2017—2021年各奖项权重
3) 根据计算得到的历届各奖项权重以及各参赛单位历届获奖的数量,依据式(5)计算各参赛单位历年的综合得分及平均数,以此为据进行合理排名.例如,2021年北京航空航天大学获特等奖1个、1等奖5个、2等奖4个、3等奖0个,结合表2所示2021年各奖项权重,由式(5)可得2021年北京航空航天大学综合得分为2.672 8,对得分进行归一化处理后结果为0.90. 2017—2021年共87所高校和单位参加比赛,表3示出排名前5的参赛单位历年得分及4年平均得分,完整的87所参赛高校和单位的历年得分情况将通过邮箱联系或GitHub的方式提供.
表3 2017—2021年得分排名前5院校
4) 历年获奖作品涉及范围广,类型繁多.通过计算并统计获奖作品题目中出现关键字的频率[11-13],并结合目前密码学领域涉及的技术及应用方向,将获奖作品进行更细粒度的划分,共划分为密码分析、区块链及应用、商密算法应用、身份认证与访问控制、数据签名及应用、算法优化、物联网、信息隐藏、隐私计算及应用和云计算及应用10个类型,如图1所示:
图1 获奖作品分类
2.1 获奖单位情况分析
根据收集、处理后的获奖数据,本文选取北京航空航天大学、中国人民解放军战略支援部队信息工程大学(以下简称信息工程大学)、西安电子科技大学这3所加权排名最高的院校进行获奖情况分析及获奖作品的整体分析.
2.1.1 北京航空航天大学
如图2所示,北京航空航天大学在密码技术竞赛中获奖数量从2017年的1个1等奖增长到2021年的1个特等奖、5个1等奖、4个2等奖.加权排名也从2017年的第5名提高到2021年的第1名,稳中有进,参与团队和获奖数量呈现明显增长趋势.北航在软件设计和工程实践这2类作品上占据较大优势,值得注意的是,在最近4届比赛中,该校斩获2次特等奖,均为软件设计类.参赛作品主要集中在算法优化和隐私计算应用上.其中算法优化类作品获奖数量多,占获奖总数的45%,且质量高,2021年第6届比赛“票据隐私保护的公平自统计电子投票系统”获得特等奖.
图2 北京航空航天大学获奖情况
图3 信息工程大学获奖情况
2.1.2 信息工程大学
信息工程大学2017—2021年获奖数量分别是10,10,8,8,获奖的总体数量处于平稳状态,保持较高的获奖能力,加权排名始终位列全国排名前4.从图3的历年获奖情况和历年加权排名可以看出,该校在密码技术竞赛早期就崭露头角、屡创佳绩.获奖作品涵盖密码学各个领域,在参赛作品类型方面擅长软件设计和工程实践,这也是学校屡获佳绩的重要原因.
2.1.3 西安电子科技大学
西安电子科技大学在密码技术竞赛中加权排名一直稳定在前5,在2017年和2018年中获奖主要集中在2等奖和3等奖,2019年斩获1个特等奖,2021年共获10个奖项,均匀分布在1等、2等、3等奖项中,说明西电的参赛作品水平呈现稳步上升趋势.该校作品种类涵盖丰富,软件设计和工程实践是其优势领域,云计算和密码算法优化占获奖总数的55%,如图4所示.但该校鲜有理论和程序编制方面的作品.
图4 西安电子科技大学获奖情况
2.2 获奖作品类型分析
2.2.1 官方大类获奖分析
全国密码技术竞赛在复赛选题阶段需将作品划定为软件设计、工程实践、程序编制、硬件制作、理论课题和其他方面,因此本节对所有参赛作品按照上述6大类别进行分类整理,并统计相关获奖情况,结果如图5所示.从总体来看,软件设计在参赛作品中占比最高,工程实践其次,软件设计在获奖方面具有明显优势.理论课题和硬件制作数量相对较少,其原因主要是理论课题和硬件制作实现难度大、作品周期长.
图5 作品类型统计
2.2.2 A,B类选题获奖数据分析
全国密码技术竞赛复赛选题有2种方式:一是选择由组委会提供的题目(以下称为A类题);
二是参赛团队自拟的题目(以下称为B类题).A类题由组委会委托国内商用密码企业根据实际应用需求出题,B类题需经组委会审核通过.为研究A,B类选题对获奖情况是否有影响,本文进行以下分析.
表4展示了2017—2021年共4届比赛A,B类作品复赛进决赛的淘汰率.该数据表明A类淘汰率低,稳定在20%以下,B类淘汰率相对较高,在50%左右.分析原因主要有2个:一是A类总数量较少,例如2021年复赛中A类总共27个,而B类有231个;
二是A类为组委会出题,题目聚焦当前形势下密码需求,解决工业界实际问题.
综合4届参赛总体数据来看,选取A或B类题目对于获奖名次高低并没有特别影响,表5列出了近4届比赛中A,B类获奖的比例,从表中可以看出无论是A类还是B类获得1等奖的概率均在10%~15%之间,获得2等奖的概率在25%左右,获得3等奖的概率为60%.
表4 A,B类作品淘汰率 %
表5 A,B类获奖情况 %
2.3 A,B类选题获奖作品分析
2017—2021历年获奖作品中,A类题和B类题分布如图6所示.由图6可知,获奖作品中算法优化类别的作品占比最高,其次是密码分析类.从图6也可以得知组委会在A类题目设计时更倾向于算法优化类和密码分析类,其中A类题中算法优化类占比高达44%,而在自选题中作品类型的整体分布更加均匀,各类型的作品均有涉及.
图6 获奖作品分布
为了提供更多参考,统计获奖占比最高的3类作品,并将这些作品在B类自命题作品中的获奖趋势一并进行绘制,如图7所示.从图7可以看出,密码分析类作品的获奖情况相对平稳,而算法优化和隐私计算及应用类整体呈现逐年递增状态,且在2021年上升趋势颇为明显,反映出参赛者更加注重于算法本身的优化,同时也与这2年隐私保护相关研究颇受密码学界的关注有关.
图7 获奖占比最高的3类作品
2.4 获奖作品领域分析
为探索不同领域作品在获奖名次上的差异情况,研究是否存在某领域作品更容易获取高名次奖项的可能,本文首次采取TOPSIS综合评价法对所有获奖作品进行分析.根据TOPSIS最优与最劣欧氏距离的大小得出不同作品的得分,结果如表6所示.从得分可以看出,数据签名及应用和物联网这2类作品的综合指标指数较高,而云计算及应用和商密算法应用这2类作品的综合指标指数相对较低.以TOPSIS方法的标准进行评判,前者获奖作品中高名次奖项占总奖项的比例更大,即该领域作品有更大概率获取高名次奖项.
通过分析产生上述差异的原因,发现综合指标指数最高的数据签名及应用类的参赛作品不多,仅占总参赛作品的4%,但是其获得高名次的奖项占参赛作品的比例较大,导致通过TOPSIS方法计算出的综合指标指数偏高.而商密算法应用类型作品在自命题类别的参赛作品占比最大,3等奖获奖作品数目远高于其他领域,且其高名次的获奖作品数目较少,导致综合指标指数垫底.因此作品选择不同领域对作品获得的名次有一定的影响,选择一个参赛作品较多的领域,想法创意容易重复,竞争更加激烈,导致其获得高名次的综合指标指数不高,而选择参赛人数相对较少的领域更方便凸显作品的创新性,更容易获得高名次奖项.
表6 各领域作品综合指标指数
3.1 作品主题的发展趋势
综合总体数据来看,竞赛参与度不断提高,作品创新性不断增强,影响力不断扩大,获奖作品的主题与当前密码学研究的热点问题紧密联系,主要呈现出如下的特点:
1) 重视国产密码应用.国产密码算法是保障我国网络安全自主可控的重要基石,密码的国产化改造和推广引起了国内的广泛关注,根据对历年参赛作品的统计,90%以上作品均采用国产密码算法,推动了我国国产密码的发展.
2) 更强调密码技术本身.纵观获取高名次的作品,其不仅能够结合实际场景形成较高的实用性和创新性,同时能够对密码技术本身进行完善精进,提出新理论、新方法、新技术,能有效地解决问题并能产生积极效果.
3) 更广的作品覆盖领域.紧跟学科/技术发展潮流的作品不仅包含传统的密码算法、密码芯片、密码协议、密码分析等技术,还涵盖区块链、数字货币、量子密码、物联网轻量级密码、云安全、个人隐私保护等当今密码学科前沿技术,充分体现了密码学科在网络空间安全领域的新需求、新场景、新特点和新应用.
3.2 获奖情况的影响因素
1) 参赛单位的重视程度及专业基础.根据本文综合排名前3的获奖数据以及对排名前3的院校的调研信息可知,其对大赛认可度高,前期对竞赛宣传力度大,学生参与度强,报名参赛队伍多,增加了其获奖数目和获奖质量的概率,同时也与其密码学研究基础或在密码学相关领域的研究投入有很大关系.
2) 作品的选题及所属的研究领域.从综合排名前3的单位来看,其参赛队伍选题涵盖了各种类型,且与当前我国密码领域研究热点问题相关,例如区块链、隐私计算等.通过TOPSIS综合评价法对获奖作品领域的分析结果可以看出,选择一个作品类型不多的小众或尖端领域,可降低作品内容和所用技术同质化的概率,一定程度上增加作品的创新性分数,提高获奖概率.
3) 作品内容的完整性、实用性和创新性.从获得较好名次和未获得名次的作品对比分析中可知,获奖作品不仅关注技术的应用,也关注技术本身的完善,作品的综合完成度高是其具备的普遍特点;
同时获奖作品往往能够有效解决题目设定的应用问题,具备较高的实用性;
获奖作品一般采用了新技术、新方法等,即使是在前人工作的基础上也会有较大改进和突破,拥有独到见解,创新性十足.
3.3 对参赛者的相关建议
根据全国密码技术竞赛历届的参赛获奖情况及本文的系统性分析结果,本文对今后的参赛单位和团队提供以下建议供其参考:
1) 参赛单位.参赛单位的组织者应高度重视,前期积极组织宣传,鼓励学生参与比赛.一方面不仅可以锻炼学生的创新能力和实践能力,提高整体水平,同时大的参赛队伍基数能有效增加整体及优秀组织奖的获奖概率,也为自身后续参加密码技术竞赛的发展进行全方位的资源储备.
2) 参赛队伍.在组队时应考虑覆盖全面,比赛涉及代码编写、文档撰写、PPT制作、汇报演讲,在各阶段要充分考虑队员优势,做到分工明确、各尽其能.同时要注意和指导老师保持良好沟通,接受多方意见,在不断地商讨中完善作品.
3) 作品领域.选择一个相对竞争压力小的领域,更易于与其他作品形成差异化.同时也可以选择以某一领域为研究核心,交叉其他领域的作品参赛,通过融合其他领域的技术特点,提升作品的技术深度.
4) 作品选题.A类题框定了作品的研究领域和内容、制定了研究方向,能够节省参赛者的选题时间,但相对B类自命题的自由度不高,如无明确研究方向的队伍可在选题第一时间关注官网发布的A类题,在对A类题目有基础且能保证作品实现的前提下可率先选择.
5) 作品内容.参赛者需区分大赛与其他赛事的作品要求,作品内容不仅要关注应用领域的新颖性,还要更多地关注密码技术本身,强调密码技术的创新性和实用性.
6) 比赛过程.复赛注重作品文档的打磨,决赛侧重作品实现和讲解.在比赛的不同阶段有不同的侧重点,注意合理分配时间.
全国密码技术竞赛自举办以来得到了各方的积极响应,集聚了丰富的技术、人才、市场等各类创新创业资源,建立了人才与企业的对接平台,展现了我国密码教育事业的蓬勃发展,推动了我国网络空间安全学科的健康发展.本文基于获奖数据对全国密码技术竞赛的历届参赛情况和获奖情况进行数据处理和可视化分析,是对全国密码技术竞赛的首次系统性分析,以此期望对未来参加此类密码技术竞赛的团队提供理论借鉴和数据参考,这是本文数据分析的价值体现.同时,在本文数据分析的基础上,可以继续利用自然语言处理技术对作品类型进行更精准的划分,利用机器学习模型对院校未来的获奖趋势及作品类型分布进行预测,这是本文未来可持续跟进研究的内在动因.
猜你喜欢获奖作品密码竞赛2020丝绸之路数学竞赛中等数学(2022年3期)2022-06-05密码里的爱保健医苑(2022年4期)2022-05-052018年书画临摹获奖作品选登老年博览·上半月(2019年2期)2019-09-10密码抗倭立奇功学与玩(2018年5期)2019-01-212018年荷赛奖获奖作品精选南风窗(2018年7期)2018-04-03我看竞赛作文通讯·高中版(2017年11期)2017-12-20创新思维竞赛(3)中学生数理化·高一版(2017年3期)2017-07-08密码藏在何处语文世界(小学版)(2016年9期)2016-09-14获奖作品选登海峡影艺(2016年2期)2016-09-06夺命密码微型小说选刊(2015年5期)2015-06-05 相关热词搜索:竞赛,获奖,密码,