最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 正文

基于Python+Pandas+Matplotlib的学生成绩数据统计与图形输出实现

来源:动视网 责编:小OO 时间:2025-10-06 06:10:36
文档

基于Python+Pandas+Matplotlib的学生成绩数据统计与图形输出实现

2019年第19期信息与电脑ChinaComputer&Communication算法语言基于Python+Pandas+Matplotlib的学生成绩数据统计与图形输出实现刘银波边静蔡红梅王艳(集宁师范学院,内蒙古乌兰察布012000)摘要:笔者以集宁师范学院计算机相关专业的学生成绩为例,对学生的成绩数据进行了细致化分析,对Python+Pandas+Matplotlib进行了相关探讨,旨在提高计算机专业教学效果。在研究的过程中,利用Python的第三方软件Pandas的数据处理功能,分析授
推荐度:
导读2019年第19期信息与电脑ChinaComputer&Communication算法语言基于Python+Pandas+Matplotlib的学生成绩数据统计与图形输出实现刘银波边静蔡红梅王艳(集宁师范学院,内蒙古乌兰察布012000)摘要:笔者以集宁师范学院计算机相关专业的学生成绩为例,对学生的成绩数据进行了细致化分析,对Python+Pandas+Matplotlib进行了相关探讨,旨在提高计算机专业教学效果。在研究的过程中,利用Python的第三方软件Pandas的数据处理功能,分析授
2019年第19期

信息与电脑

China Computer & Communication

算法语言

基于Python+Pandas+Matplotlib的学生成绩

数据统计与图形输出实现

刘银波 边 静 蔡红梅 王 艳

(集宁师范学院,内蒙古 乌兰察布 012000)

摘 要:笔者以集宁师范学院计算机相关专业的学生成绩为例,对学生的成绩数据进行了细致化分析,对Python+Pandas+Matplotlib进行了相关探讨,旨在提高计算机专业教学效果。在研究的过程中,利用Python的第三方软件Pandas的数据处理功能,分析授课性质、时间、性别、生源地等方面与学生成绩之间的内在联系,并借助Matplotlib的可视化展示功能,将他们之间的关系通过图像的方式展现出来,对计算机专业学生的发展具有重要的意义。

关键词:Python;Pandas;Matplotlib;学生成绩;数据统计;图形输出

中图分类号:TP311.52  文献标识码:A  文章编号:1003-9767(2019)19-043-03 Realization of Statistics and Graphic Output of Students'Achievement Data

Based on Python+Pandas+Matplotlib

Liu Yinbo, Bian Jing, Cai Hongmei, Wang Yan

(Jining Normal University, Ulanchab Inner Mongolia 012000, China)

Abstract: Taking the results of computer-related majors in Jining Normal University as an example, the author makes a detailed analysis of the data of students'achievements, and makes a related discussion on Python+Pandas+Matplotlib, aiming at improving the teaching effect of computer specialty. In the course of the research, using the data processing function of Pandas, a third-party software of Python, to analyze the internal relationship between the nature of teaching, time, gender, students'origin and students' performance, and with the help of Matplotlib's visual display function, to show the relationship between them through the way of images, is of great significance to the development of computer majors.

Key words: Python; Pandas; Matplotlib; student achievement; data statistics; graphic output

0 引言

Python语言有跨平台、开源、通用等诸多特征,自从被研发出来就得到社会各界的广泛应用。新时代背景下,社会的不断进步推进了Python发展进程。由于Python容易掌握、应用广泛和具有丰富的第三方数据库,受到了早期编程领域的青睐。现阶段将Python+Pandas+Matplotlib编程的图表绘制、数据汇总分析等功能应用在学生成绩分析上,将学生的成绩数据可视化,有助于更全面地掌握学生的课程学习情况,对学生及学校的发展具有重要的意义。

1 发展现状

Python作为一种对数据解释型的编程语言,在20世纪90年代就已经被研发,但是其在2000年后才得到迅速发展。目前,Python已广泛应用在云计算、Web研发、人工智能、科算、金融图形GUI等领域[1-3]。由于Python语言结构清晰明确、拥有丰富的第三方库、技术相对将成熟、具有强大的科学计算及数据分析能力,所以其利用效率远超过C语言、C++语言及Java。目前,Python发展中涉及的第三方库主要有NumPy、SciPy、Matplotlib、Enthought librarys、pandas等。在数据分析处理领域,通过运用Python编程语言对各种数据进行汇总、筛选、处理分析,有助于为应用行业的战略性发展提供借鉴。另外,Python在学生成绩统计、校园一卡通数据分析、实验数据的统计和分析等方面也取得了不错的发展成绩。

2 学生成绩数据统计处理、分析

采用合适的数据结构对数据进行表达,运用合适的算法对数据进行分析和处理是计算机所有程序开发的重要基础。Python本身拥有丰富的数据库,能为第三方库提供相关

基金项目:集宁师范学院自然科学研究一般项目“基于Python的数据分析及可视化研究”(项目编号:jsky2018028)。作者简介:刘银波(1990—),女,辽宁庄河人,研究生,讲师。研究方向:计算机先进控制策略研究。

2019年第19期

信息与电脑

China Computer & Communication

算法语言

的结构组织和重要的数据表达依据,如pandas 的series 及DataFrame 类型。本文主要参考了集宁师范学院计算机相关专业学生的成绩,运用Python+Pandas+Matplotlib 相关的计算机编程对学生的成绩进行了分析汇总,通过可视化图像了解学生学习成绩的变化以及分布。2.1 数据预处理

原始数据为多个Excel 文件,需要将班级相同的Excel 文件合并,方便后续处理数据。由于数据本身比较混乱,比如,同一门课程在不同班级成绩文件中的位置不一样,同一门课程的课程编号不一样,会造成数据处理不便,本文引入配置文件指明课程在不同班级所在的位置。另外,此次研究中,遇到Excel 处理数据方便时,依然会选择Excel 数据处理的功能。

2.2 数据分析及可视化2.2.1 班级成绩横向对比

将2013级至2017级教育技术专业各班的学生成绩进行对比,只抽取大学英语、高等数学以及程序设计基础作为考察对象,成绩分布折线图如图1所示。从图1可以看出,程序设计基础和高数(一)的成绩普遍偏低,所以要加大这两门课程的教学力度。其中,15教技1班和2班的程序设计基础与其他科目的成绩相差比较大,17教技1班的大学英语(一)与其他科目相差较大,不符合学生的整体学习水平,可能与试卷的难度有关。高等数学(二)平均成绩偏高,应在今后考试中加大难度,增加应用型题目。

13教

1班

14教

1班

14教

2班

15教

1班

15教

2班

15教

i o

s 1

16教

1班

17教

1班

16教

2班

班级

分数

100806040200

程序设计基础

高等数学(一)

高等数学(二)

大学英语(一)大学英语(二)图1 班级各科目平均成绩

2.2.2 学生个人学习成绩分析

针对学生的个人学习成绩,从时间和课程两方面进行分析,图2为该生在校期间从低年级到高年级的成绩分布。从图2可以看出,该生在大一刚入学阶段,学习成绩波动较大,后续的课程都能保证70分以上,该生学习成绩总体良好。成绩如此分布的原因如下:由于刚进入大学阶段,没能尽快适应大学生活,不能处理好学习和生活的关系,造成大一成绩波动较大;该生的专业课成绩较高,而大一课程大部分为通识教育课和专业基础课,可知该生不重视通识教育课程。

该生课程成绩分布的雷达图如图3所示。从雷达图可以看出,

该生各科成绩发展均衡,但依然能看出专业课成绩较高。

图2 学生A 在校期间成绩分布图

程序设计基础

计算机导论

思想道德修养与

法律基础

大学英语(二)

高等数学(二)高等数学(一)

80

60

40

20

静态网站设计

高等数学

数字电路与逻辑设计

Java核心技术(上)

大学英语(一)

网络编程基础

Linux操作系统基础

线性代数

图3 学生A 各科成绩分布雷达图

3 成绩较高学生的特点

针对教育技术专业所有班级,取每个班级综合成绩前5名的学生作为分析对象,由于数据来源有限,仅从性别和生源地两方面分析。图4为样本中性别比例饼图。从图4可以看出,女生占样本的93%,这也是很多专业的普遍现象,可见在大学女生愿意在学习上下功夫。分析生源地使用python 语句,通过百度地图API 获取生源地经纬度,软件库folium 可以实现对openstreetmap 的调用,用于生成地图,将成绩作为热力数据。图5为样本中生源地的分布图热力图。笔者所在单位的生源全部来自内蒙古自治区,从图5可以看出这部

分成绩较高的学生大部分来自呼和浩特市、包头市、乌兰察

布市以及赤峰市,可见这些地方的基础教育比较扎实。

性别分布

4 Python+Pandas+Matplotlib 探讨

基本分析:对数据进行统计分析的方法主要有计算和、

信息与电脑

China Computer & Communication

算法语言

差值、方差、均值等,然后通过折线图、饼图、直方图的表达方式对数据进行可视化处理。利用Pandas中的函数可以对数据进行基本的分析处理。Python+Pandas+Matplotlib通过对学生的成绩进行统计和分析,有助于掌握学生的实际学习状况及学习中存在的问题,可以分析学生整体的成绩水平,同时能将各个学期的学习成绩进行对比,有助于更全面、准确、客观地对学生的实际学习动态进行分析掌握,还有助于分析每个学生的整体学习发展趋势。另外,通过将学生的成绩进行可视化的数据分析,还有助于教师制订符合学生实际发展的教学计划,还有助于对新教学模式的可实施性进行探

讨,有助于学校的发展。

图5 生源地分布热力图

深度分析:在应用数据挖掘技术和相关的算法时,经常运用聚类、关联分析、分类回归几种方式。聚类主要是将整个数据划分为不同的小组,使群与群之间的差异更加明显,为了保证数据具有较强的可实施性,组内的数据应当尽量相似。关联分析主要能够寻找出数据中值之间的相关性,关联分析和序列模式是关联分析常用的方式,关联分析的主要目的是寻找出不同数据之间的关联性,序列模式主要针对的是事件之间在时间上的关系性[4]。对数据进行分类的主要目的是构造一个分类函数或模型,进而达到数据映射效果。回归能够通过已知数值对未知数值进行有效预测,常用的回归方式为线性回归、非线性回归这两种标准数据统计技术。

深度分析的应用范围较广泛,例如以了解学生的特长为目的进行数据分析,将计算机专业学生的专业课程依照聚类算法进行分类,能够将同种类型的学科进行归类,常见的类型有社科类、程序设计类、电学科类等。对学科进行分类之后,依照类别对每位学生的实际成绩进行数据分析,有助于了解学生在不同课程类别中是否具有特长。对于公修课程及专业基础课程,由于课堂班级较多,通过分析各个班级的成绩分布,将整体成绩进行对比,有助于及时发现班级整体的学习问情况及问题。对于不同类型的课程,可以利用数据关联分析法,通过对学生的成绩进行分析有助于分析学生成绩与专业课设置之间存在的关联性,有助于优化和完善教学方案。

5 结 语

随着时代的不断发展,现阶段Python已经成为社会各个领域重要的编程语言,主要是由于其具有较广的覆盖范围且具有丰富的科学计算库。其中,适用于与数据科学相关的Pandas,能够高效率地对大型数据进行可视化操作。通过将Python+Pandas+Matplotlib技术应用在学生成绩统计和分析中,能够掌握学生的整体学习动态,对学生成绩进行整体把握具有积极的意义。

参考文献

[1]刘雨珂,王平.基于Python+Pandas+Matplotlib的学生成绩数据统计与图形输出实现[J].福建电脑,2017,33(11):104-106.

[2]黄建军,李宥谋,刘婧,等.基于Python语言的自动化测试系统的设计与实现[J].现代电子技术,2017,40(4):39-43.

[3]胡哲,马骏,赵艳雄,等.基于Python和MA TLAB的CAE可视化分析平台的设计开发[C]//第24届全国结构工程学术会议论文集,2015:39-43.

[4]张明浩,王虹宇,张毅宁.基于Python技术的自然图像随机数生成设计[J].电脑与电信,2017(8):13-15.

于每一种设备开发一种专门的程序语言不具备可操作性,而JAVA语言可以满足这些后信息时代PC的需求,占用少量内存、直接搭载于各种电子产品、在网络中被所有设备识别,这是JAVA语言得天独厚的优势。

5 结 语

随着JSP技术的进一步发展,JAVA语言的网络应用更加实际化、效率化,不可否认JAVA已成为IT产业最常用的技术。可以预见的是,在不远的将来,JAVA语言会进一步改变传统Microsoft格局下的程序开发格局,使网络服务、软件服务、系统操作更加效率化、便利化、安全化、丰富化。

参考文献

[1]王昊欣,姜学东.JA V A编程语言在计算机软件开发中的应用[J].电子测试,2017(13):73-74.

[2]董朝贤.Java编程语言在计算机软件开发中的应用[J].现代信息科技,2019,3(13):124-125.

[3]高阳.JA V A编程语言在计算机软件开发中的应用[J].电脑迷,2018(13):47.

[4]阎双.论JA V A编程语言在计算机软件开发中的应用[J].数码世界,2019(8):54-55.

[5]杨兰.计算机软件开发的JA V A编程语言及其实际应用[J].电子设计工程,2017,25(21):49-52,56.

(上接第42页)

文档

基于Python+Pandas+Matplotlib的学生成绩数据统计与图形输出实现

2019年第19期信息与电脑ChinaComputer&Communication算法语言基于Python+Pandas+Matplotlib的学生成绩数据统计与图形输出实现刘银波边静蔡红梅王艳(集宁师范学院,内蒙古乌兰察布012000)摘要:笔者以集宁师范学院计算机相关专业的学生成绩为例,对学生的成绩数据进行了细致化分析,对Python+Pandas+Matplotlib进行了相关探讨,旨在提高计算机专业教学效果。在研究的过程中,利用Python的第三方软件Pandas的数据处理功能,分析授
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top