依靠上一篇的51Job数据抓取程序,本篇我以嵌入式软件行业为例,基于51Job上的职位信息进行了一些简单的分析。
只要稍微更改搜索关键词就可以十分方便的应用在其它行业。
哪个城市的嵌入式需求更多?
思路:根据51job的所有城市名,获取关键词——“嵌入式”的搜索页数,以页数作为城市需求量的热力值,绘制城市热力图。
结果:绘制的城市热力图如下,也可以查看网页版的嵌入式城市热力图.html,支持缩放和鼠标悬浮显示数据等操作:
我把城市热力值按颜色分了3个层次——青、红、黑。
黑色:60往上的属于第一梯队,深圳131、上海103;
红色:60-30的属于第二梯队,广州40、杭州36、北京34、南京34、武汉34、苏州31;
青色:30-8的属于第三梯队,成都27、西安19、合肥13、无锡12、长沙11、东莞10、重庆8、宁波8、佛山8、珠海8;
代码如下:
1 | # coding:utf-8 |
不同工作经验的工资情况?
思路:抓取“嵌入式 软件 -c 南京”的数据。读取csv数据,根据不同的工作年限算出平均工资,绘制柱形图。
结果:通过关键词获取到1500条职位信息,其中1189条包含工作经验的工作信息。计算并绘制出下图:
代码如下(以上结果为median取值):
1 | # coding:utf-8 |
不同学历的工资情况?
思路:根据不同的学历,从低到高,依次计算上面的平均工资,绘制柱形图。
结果:
对于学历要求的职位数量统计:
不同学历在不同工作经验的薪资水平,图示如下:
从上可以看出,学历对于嵌入式从业的影响是十分正相关的,中专、大专、本科、硕士一级一级工资的增长肉眼可见。博士就比较魔幻了,可能是已经到另一个境界了吧。
代码如下:
1 | # coding:utf-8 |