2021年帆软杯一等奖作品 |《基于数据可视化的中国编程岗位需求分析》
# 作品主题 #——基于数据可视化的中国编程岗位需求分析
一、团队介绍
团队名称:汪汪队立大功
团队成员:乔好鑫、许春阳、窦晨辉
指导老师:施金妹
团队的三位成员均是来自于海南科技职业大学大数据技术与应用专业,专业课主修了python,java等多门有关编程语言课程,经过系统化课程的学习,对编程语言有了一定了解,同时也激发了他们对编程浓烈的学习兴趣。带着这样一份对编程的学习热情促使他们组合在一起,共同深入了解编程,一起进步。
二、作品背景和设计思路
在大数据时代的背景下,编程岗位是一个炙手可热的大分类岗位,作为大数据技术与应用专业的大学生,出于对未来就业方向的思考,选择了中国编程岗位需求这一方向,旨在通过FineBI对C、Java、Python三大编程岗位网上招聘信息进行可视化分析,从而更好选择就业方向,明确就业目标。
确定好主题之后,首先明确了团队的设计思路,把编程招聘网站的选取作为第一步,以此确定数据来源,经过团队讨论、指导老师建议后,最终将目光放在了三个高频公认的招聘网站上:boss直聘、猎聘、前程无忧,通过对网站招聘信息的字段检索、板块分类,得到了初步的信息,再经过数据分析、数据处理等流程,最终得到可视化的数据分析图。
三、作品亮点
亮点一:真实、具有时效性的数据选择
首先是对编程语言的界定,在中国知网上以关键字、主题检索方式,检索出两万七千篇相关论文,经过筛选最终得到研究频次最多的编程语言,以此为基础,总结出了这三类编程语言被高频公认的招聘网站,分别是boss直聘、猎聘、前程无忧,从而进行信息爬取。
亮点二:规范化数据清洗,为分析做足准备
1、去除脏数据
在对招聘网站进行关键词C、Java、Python的检索时,难免会出现与需求信息不相符合的招聘信息,如C驾驶司机、蔬菜配送员等,经过数据筛选将无关信息剔除。
利用Excel的函数、筛选功能对数据进行预处理,保留岗位的名称,对城市、工作经验和学历进行切割并去除空值,下方是部分展示。
2、统一薪资值
在招聘信息爬取的过程中,由于薪资提供信息多为范围取值,所以需要对薪资信息进行进一步处理。具体方法是将范围分为上限与下限,进行平均薪资的计算。
充分利用Excel中的分列功能对原始数据进行前后切割,并通过均值函数对薪资进行平均计算且统一薪资的单位为(K/月),得到全新处理的数据,为导入FineBI做最后的准备。
3、分组统计
处理过的数据导入FineBI自主数据集后,创建自助数据包,对部分字段进行识别处理,字段设置名为学历要求、经验要求、岗位、记录数、平均薪资、公司,用以对岗位分析做进一步的操作。
在统计操作中对部分数据进行了分组,例如软件工程师又有初中高等级划分,把这些进行了归类统计,使统计结果更加简单明了,方便理解。
将处理好相关招聘数据导入FineBI中进行仪表板的设计与呈现。
根据数据类别分模块处理,利用软件中一系列不同样式的组件,统一配色,达到清晰准确展现出中国编程岗位需求情况的目的。
亮点三:美观、板块化的可视化界面
模块一:boss直聘热门城市三大编程岗位
· 数据概况 ———
boss直聘平台上共爬取了6460条相关记录,C岗位数量3811,Java岗位数量1106,Python岗位数量1543,总体上来说,boss直聘上C岗位招聘的数量是最多的。
北京、上海、杭州编程岗位招聘数量居于前三。
· 高薪工作TOP榜 ———
以矩形树图来进行分析,由图可知,薪资最高的是华为公司,其薪资为40K,第二、三为华为技术有限公司、西安华为同属于华为分部,其他公司紧随其后。由此可知,华为作为目前编程岗位薪资水平最高的公司,如果从薪资方面考虑,华为的编程岗位是最为优质的选择。
· 工作经验— —平均薪资统计分析 ———
以漏斗图来进行分析,根据数据图可知,平均薪资水平的高低并不是经验越高获得的平均薪资就越高,反而呈正态分布,除去经验不限,平均薪资最高的是1-3年和3-5年分别是47K和46K。可以得出结论,目前编程岗位具有1-5年经验的从业者具有较高的薪资水平,说明编程岗位对经验的要求并没有很高的限制,初入行业的新人也可能得到不错的薪资待遇。
模块二:猎聘热门城市三大编程岗位
· 数据概况 ———
· 平均工资——经验、学历要求 ———
采用聚合气泡图,将经验要求和学历要求分别设为横纵轴,以平均工资为颜色、形状、细粒度进而展示出三者之间的关系。
由图可知,经验在一年以上且学历在本科以上的平均工资偏高,但三者之间不是绝对的关系,学历、经验不限的情况下,也存在较高平均工资的情况。
将学历要求和平均薪资以玫瑰图的形式呈现,博士学历的平均薪资更高,占比更大。
以经验为纵轴,对比岗位数量和平均薪资。可以看出,经验不限的岗位数量最多,经验要求十年以上的岗位数量最少;在平均薪资方面,十年以上的经验要求薪资水平最高,一年以下的平均薪资较低。
模块三:前程无忧全国三大编程岗位
· 数据概况 ———
· 岗位需求分布 ———
从地图分布图来看,工作岗位多分布在东部和沿海地区,其中珠三角、长三角、京津冀、川渝等地区聚集了大量的工作岗位且薪资水平也相对比较高,而西部地区的岗位需求比较少。如果对薪资水平有较高需求的求职者,这些地区不失为一个好的选择方向。
从下方词云图、饼图、面积堆积图、折线图来看,最热门的工作岗位为java开发工程师和软件工程师,平均薪资分布在0-20K范围内,其中拥有3-4年工作经验的岗位数量最多。
三、作品亮点
本次可视化项目的作品是集聚了整个团队的共同努力,对团队里的每一个人来说都是一种新的挑战。回顾此次作品的创作,我们也收获了许多。在数据选择与爬取处理方面,更加明白了数据真实性、时效性的重要性,切记不可因为自身的方便操作从而主观的删除部分数据,是不可取的行为。在参赛的过程中加深了FineBI的使用,对数据的可视化分析有了更为直观且动态化的了解。对于未来就业选择也有了更为清晰的方向,如今的学习更是确定了目标、增加了学习动力。