大数据与智能信息处理研究工程中心建设工作汇报
计算机学院 2021年11月
1. 大数据与智能信息处理研究工程中心建设情况
我校大数据与智能信息处理实验平台是为学校学生、老师、科研人员和管理员进行大数据专业教学上课、在线实验、在线考试以及进行相关大数据技术科研工作的教学科研平台。大数据实验室平台通过私有云计算及虚拟化技术使得学生、老师和科研人员可以获取自己专属的虚拟机,从而进行在线教学实验和科研工作。平台还提供了一些教学辅助功能,如:大数据课程管理系统,大数据考试系统,大数据远程协助系统等,以辅助教师和学生进行课堂教学工作,提高教学效率,优化用户体验。平台还内置配套大数据专业教学内容,包括:课程教材、实验手册、实验案例和海量行业数据。
平台涵盖了云计算虚拟机管理系统、大数据课程管理系统、大数据在线实验系统、大数据远程协助系统、大数据在线考试系统、大数据实验室管理系统等。
1.1 教学体系建设
根据大数据与云计算虚拟仿真实验中心申报规划,我校将建设集学习实践平台、理论教材、实验手册、教师讲义、视频课程、实验数据、行业认知训练、产业实战应用课以及师资培训于一体的虚拟平台,解决专业课程“教什么”、“怎么教”、“由谁来教”、“教到什么程度”4个关键问题。教学体系内容涵盖面较为广泛。平台教学体系架构图如下:
1.2 课程体系建设
我们依托国家“十三五”规划纲要及教育部“行动计划”,开展课程体系建设要以学科建设为指导,强调培养具有大数据实践能力的大数据人才。重点培养具有以下两方面素质的人才:一是工具的掌握,掌握数据采集和数据分析的基本工具;二是数据分析能力,掌握实用数据分析和初步数据建模能力。
现有建成课程内容包括:《Linux操作系统》、《数据库原理与应用》、《Java程序设计》、《Java Web程序设计》、《Python课程资源包》、《SQL数据库应用》、《数据结构与算法》、《计算机网络》。
课程名称 |
课程描述 |
《Linux操作系统》 |
《Linux操作系统》是为高校计算机相关专业编写的Linux操作系统教材。全书共分11章,内容包括Linux操作系统安装、Linux桌面管理、Linux常用命令、文本文件编辑、用户管理、设备管理、DHCP服务器、Samba服务器、FTP服务器、DNS服务器和Apache服务器。 |
《数据库原理与应用》 |
系统全面地阐述了数据库系统的基本概念、基本原理和应用技术,主要内容包括数据库技术概述、关系数据库、关系数据库的标准语言SQL、关系数据库设计、数据库保护、网络数据库、网络数据库管理系统SQL Server 2000、分布式数据库系统、XML数据库等。 本书概念清楚、重点突出、章节安排合理,理论与实践结合紧密。每章配以丰富的习题、案例及实验,有助于读者加深对内容的理解、掌握并巩固概念;案例为读者提供了真实的数据库应用场景,有助于读者从实际应用的角度出发,联系所学理论,掌握所学内容;而实验为读者提供了将理论与实践相结合的具体上机操作途径,最终巩固所学内容。习题、案例与实验的设计也是本书一个比较突出的特点。 |
《Java程序设计》 |
《Java程序设计》通过对Java编程语言的全面介绍,引导快速地掌握Java编程语言的核心内容并学会灵活运用所学的语言知识及面向对象的编程思想。《Java程序设计》共分9章,内容包括Java语言概述、面向对象编程初步、Java的基本语法、类库与数组、面向对象编程深入、Applet程序、图形用户界面编程、异常处理和输入输出,以及多线程编程。 |
《Java Web程序设计》 |
通过Java Web开发常用技术及框架(Spring、SpringMVC、Hibernate、Mybatis)结合数据库知识,实现Java Web开发内容学习。总体内容结构清晰、划分合理。将帮助学生更完整的了解Java研发体系。 |
《Python程序设计》 |
本书是一本针对所有层次的Python读者而作的Python入门书。全书分两部分:首部分介绍用Python 编程所必须了解的基本概念,包括matplotlib、NumPy和Pygal等强大的Python库和工具介绍,以及列表、字典、if语句、类、文件与异常、代码测试等内容;第二部分将理论付诸实践,讲解如何开发三个项目,包括简单的Python 2D游戏开发,如何利用数据生成交互式的信息图,以及创建和定制简单的Web应用,并帮读者解决常见编程问题和困惑。 |
SQL数据库应用 |
通过系统的学习NoSQL的来源及应用场景,结合Redis、MongoDB、Neo4j、Hbase完成对键值数据库、文档数据库、图形数据库、列族数据库的学习。实现NoSQL数据库的完全掌握及应用。 |
《计算机网络》 |
由于本书的重点立足于计算机网络的基本原理,同时兼顾了Internet体系结构与TCP/IP协议等内容,因此对于学习计算机网络课程的本科生和研究生,本书都是的教材或教学参考书。本书每章后面给出了大量练习题,有助于教师根据教学目的酌情安排课后练习。 |
数据结构与算法 |
以基本数据结构和算法设计策略为知识单元,系统地介绍了数据结构的知识与应用、计算机算法的设计与分析方法,主要内容包括线性表、树、图和广义表、算法设计策略以及查找与排序算法等。《数据结构与算法》注重理论与实践相结合,内容深入浅出,可以作为高等院校计算机学科相关专业的教材或参考书,同时对计算机科技工作者也有参考价值。 |
1.3 师资培养建设
学校以人才计划为依托,围绕学科专业、科研平台和团队建设的需要,对中心的人才进一步加大培养与引进力度,采取项目支持或专项资助等措施,通过特聘岗位和柔性引进等方式,汇聚一批高层次人才。引进了博士张玢、葛莉2名,采取积极措施鼓励教师到国内外重点高校攻读博士学位,已有3名教师获得了博士学位。每年选派2-3名中青年教师到国内知名高校培训进修,先后有12名教师得到了培训,进一步提升了教学、实验及科研水平。同时,通过“理论+实践”的培训形式,结合成熟的课程体系,为专业课任课老师进行系统综合的课程培训,同时通过横向课题提供真实项目的参与,帮助打通其理论知识与产业实践无法结合的关卡,对自身的教学素质做进一步提升,从而能够顺利胜任专业的授课工作。
2. 中心开展的主要工作
我校大数据与智能信息处理实验中心于2019年申报并获批,前期建设过程中,发现了许多存在的矛盾和问题。后续中心的主要工作将从以下几个方面展开:
2.1 扩充课程体系内容
由于我校大数据的教学过程中停留在理论阶段的较多,少有贯穿大量的实验实践内容,无法完成理论与实践相结合,也无法真正呈现出务实可观的教学成果。大数据分析教学偏重理论知识的传授,使得学生难以接触实际问题,应用能力还存在很多提高的空间,教学资料的匮乏,课程内容的不成熟甚至是空白,让“讲什么”,“怎么讲”成为目前老师面临的尴尬问题。下一阶段,中心将从课程体系建设、课程实验配置以及实训实践等内容对平台资源进行扩充。
2.2 加强师资培养建设
由于我校教师理论及技术水平参差不齐,导致学校专业的建设质量,学科的成长发展以及专业整体教学水平受到了很大程度的制约。下一阶段,我们将通过校外专家指导、会议培训、企业培训等方式从现阶段高水平大数据人才具备的必要素质角度出发,提高我校师资队伍的理论水平,同时提升我校师资队伍的企业级大规模应用经验,使教师不仅能够对理论研究做进一步延伸推论,还能够将理论与企业应用实践相结合进行教学实施。
2.3 提升大数据科研工作环境
以互联网为代表的通信技术和以物联网为代表的传感技术的持续创新和广泛应用使人类的数据化能力和范围快速扩张,产生的能够被测量和记录的数据量越来越大,而我们对事物、现象等的测量、记录也更加频繁和细致。海量数据的剧增,势必让量变引起质变,直接在科学研究领域,为科研模式带来极大的改变。继实验科学、理论科学、计算科学之后出现了第四种研究范式,即‘数据密集型科学’,成为大数据时代下的新科研模式。然而现阶段我校的科研模式依然在第四范式之外徘徊,原因在于学校不具备数据密集型科研模式所需要用的科研设备以及科研方法。下一阶段,中心将进一步加快大数据平台的建设工作,尽可能提升师生的工作、学习环境。
2.4 加快大数据实践平台建设
普通计算机专业学生一台机器即可完成学习练习任务,但是大数据课程的实验至少需要2~3台机器才能满足需要。我校实验室资源尚无法满足这样的硬件诉求。大数据课程前后课程关联紧密,要求对前课实验成果进行保留。所以实验机和学生之间存在专属性!这点又呈几何倍数增加了硬件需要!下一阶段,中心将尽可能争取更多经费,加快平台建设步伐,尽可能满足师生教学任务的需求。
2.5 提高学生就业能力
现阶段,大量社会企业很难找到合适的大数据人才,而且大数据岗位在任何企业公司都是关键咽喉岗位,企业纵然对此类人才求贤若渴,但依然秉持宁缺勿滥原则,导致企业人才招聘困难,成效低下。学生在学校没有机会接触实际项目,没有真实案例进行实战演练,没有行业技术大牛从旁进行宝贵经验的灌输,也就无法胜任企业的需求。下一阶段,中心将着重通过学生的实习实训,提高学生的企业实战经验和技能,完善就业培训机制,大力提升学生的就业能力。