一、专业定位
数据科学与大数据技术专业是计算机科学、数学、人工智能技术的交叉学科,涵盖大数据的采集与处理、存储与管理、分析与应用多个方面内容,从行业角度对含有高价值的海量数据进行管理分析和系统研发。该专业是一个理实结合、以计算技术为基础、兼顾数据科学理论与应用、围绕数据价值化为目标的宽口径专业。
本专业以国家大数据发展战略与广东省数字经济发展需求为导向,结合学校石化产业特色背景,服务于广东省省及区域经济的人才需求,建设面向大数据研发和产业应用的复合应用型人才培养体系。在培养定位上,围绕数据科学基础理论和大数据管理应用两大核心内容,突出石化大数据特色,重点培养学生的大数据分析建模能力、计算机实现能力和大数据工程应用实践能力。通过全方位的课程设置和实践教学环节设计,毕业生将具备大数据分析、处理、服务、开发和利用、沟通和创新等多个方面的知识和技能,能在政府、企业、事业、国防等单位从事大数据的系统构建、理解与计算、分析与应用等工作,就业前景广阔。
二、培养目标
面向国家、特别是广东省区域大数据产业发展需求,培养具有高尚的职业道德和社会责任感;掌握大数据采集、预处理、存储、计算、分析、可视化、简单数据挖掘等技术;拥有自我学习能力和创新意识,适应社会需求;具有能够从事大数据相关岗位(大数据环境运维、大数据爬取、大数据分析与可视化、大数据挖掘、大数据技术应用)职业能力的高素复合应用型人才。
培养目标可以归纳为以下5 项:
目标1:具备良好的道德情操和科学文化素养,具备有效协调和科学处理专业相关工程实践与社会、环境可持续发展方面的能力;
目标2:能适应行业大数据应用的发展需要,具备综合运用数学与自然科学基础知识、大数据科学与工程专业知识对大数据复杂工程问题进行分析、研究、解决的能力;
目标3:能综合运用专业理论和技术手段,能够从事大数据工程领域的设计、开发、运营、管理、决策等工作,具有创新意识;
目标4:能积极适应工作环境,具备良好的协调、沟通、竞争与合作能力,具备一定的组织管理与执行能力;
目标5:终身以学习为乐,具备开阔的国际视野,能紧跟专业发展前沿,不断进取、促进数据科学领域的产品创新与转型升级。
三、培养规格
本专业学制为四年制,要求修满162个学分,本专业对学生知识要求、能力要求与素质要求如下:
1.工程知识:具备扎实的数学知识,系统掌握数据科学与大数据领域的工程基础和专业知识,能够描述、分析和解决数据科学与大数据领域复杂工程问题。
1.1能够将数学、自然科学、工程科学的语言用于工程问题的描述;
1.2能针对数据系统分析、开发与应用中的具体对象和过程建立数学模型并求解;
1.3能够从数学、工程基础和计算机专业知识的角度对复杂工程问题进行推演和分析,并尝试改进。
2.问题分析:具备良好的数学基础和规范、严谨思维,比较全面掌握数学的基本知识、理论和技能,掌握大数据基本技术,平台软件,对实际问题进行分析解决的能力。
2.1能运用数学、自然科学和计算机科学的基本原理,识别和判断数据密集型复杂工程问题的关键环节。
2.2能基于相关科学原理和数学模型方法正确表达大数据工程问题;
2.3能够通过分析文献对数据科学和大数据领域中的复杂工程问题提出多种解决方案。
2.4能够对理论和实际结果之间的差异进行合理解释,并获得有效结论。
3.设计/开发解决方案:能够以行业大数据分析基本知识和基本理论为背景,熟练掌握与行业应用相关的数据分析、建模和实践技能,并能够在设计环节中体现创新意识,考虑社会、健康、安全、法律、文化以及环境等因素。
3.1掌握工程设计和产品开发全周期、全流程的基本设计/开发方法和技术,了解影响设计目标和技术方案的各种因素;
3.2能够针对特定需求,完成数据分析和大数据应用系统模块(部件)的设计;
3.3能够分析现有解决方案的不足,提出改进的设计方案,体现创新意识。
3.4在大数据系统设计中能够考虑安全、健康、法律、文化及环境等制约因素
4.研究:能够基于科学原理并采用数据科学与大数据的方法对复杂的数据系统工程进行研究,包括设计实验、分析与解释数据、并通过信息综合得到合理有效的结论。
4.1能采用计算机技术、数据科学与大数据技术及相关方法对复杂的工程问题进行研究,能够设计相应的实验方案。
4.2能够根据实验方案构建实验系统,安全地开展实验,正确地采集实验数据;
4.3能采用数据分析方法,针对复杂工程问题的不同解决方案,进行理论分析、仿真实验,并通过信息综合得到合理有效的结论
5.使用现代工具:能够针对数据科学与大数据领域复杂工程问题,开发、选择与使用恰当的技术、软硬件及系统资源、现代工程研发工具和信息检索工具,包括对复杂工程问题的预测与模拟,并能够理解其局限性。
5.1能够跟踪数据科学和大数据领域的前沿技术,并能在工程开发中选择和使用新技术。
5.2掌握数据科学和大数据的重要资料来源及获取方法,包括网络搜索工具使用方法和在工程实际中获取相关信息的基本方法。
5.3能够将计算机以及信息系统技术应用于数据科学和大数据领域中复杂工程问题的设计、模拟,并理解其局限性。
6.工程与社会:能够基于大数据知识、工业生产、商业、交通、医疗等方向的背景知识进行合理分析,评价专业工程实践和复杂工程问题解决方案对社会、健康、安全、法律以及文化的影响,并理解应承担的责任。
6.1能够理解数据科学和大数据从业者的实践活动对社会带来的影响和应承担的责任。
6.2认识工程问题与社会伦理道德之间的联系,树立正确的工程伦理观,具备高度的社会责任感从事工程活动。
6.3能够评价具体的工程实践活动对社会、健康、安全、法律以及文化方面的积极影响和消极影响。
7.环境和可持续发展:能够理解和评价针对数据科学与大数据领域复杂工程问题的专业工程实践对环境、社会可持续发展的影响。
7.1能够理解和评价数据科学与大数据相关工程实践对环境、社会可持续发展的影响
7.2能够理解数据科学和大数据领域技术手段在工程实践中的作用及其局限性,建立正确的工程观。
8.职业规范:具有人文社会科学素养、社会责任感,能够在工程实践中理解并遵守工程职业道德和规范,履行责任。
8.1理解社会主义价值观,了解国情、维护国家利益,具有人文知识、思辨能力、处事能力和科学精神。
8.2具有诚实公正、诚信守则的工程职业道德和规范,并能在数据科学与大数据工程实践中自觉遵守。
8.3理解数据工程师对公众的安全、健康和福祉,以及环境保护的社会责任,能够在工程实践中自觉履行责任。
9.个人和团队:能够在多学科背景下的团队中承担个体、团队成员以及负责人的角色。
9.1能够与其他学科成员进行有效沟通,独立或合作开展多学科交叉合作工作。
9.2能在多学科背景下的团队中承担个体、团队成员以及负责人的角色,能组织、协调和指挥团队开展工作。
10.沟通:能够就数据科学与大数据技术领域的复杂工程问题与业界同行及社会公众进行有效沟通和交流,包括撰写报告和设计文稿、陈述发言、清晰表达或回应指令,并具备一定的国际视野,能够在跨文化背景下进行沟通和交流。
10.1能够就数据科学与大数据技术领域的专业问题,以汇报答辩、技术报告等方式,与业界同行和社会公众进行有效沟通和交流。
10.2了解专业领域的国际发展趋势、研究热点,理解和尊重世界不同文化的差异性和多样性;
10.3具备跨文化交流的语言和书面表达能力,能就专业问题,在跨文化背景下进行基本沟通和交流。
11.项目管理:理解并掌握数据科学与大数据技术领域工程项目管理原理与经济决策方法,并能在多学科环境中应用。
11.1理解并掌握数据科学与工程活动中所涉及的重要经济与管理因素,掌握数据科学与大数据技术领域工程项目中涉及的管理原理与经济决策方法;
11.2理解工程项目的时间及成本管理、质量及风险管理、人力资源管理以及安全管理等,并在多学科环境中应用。
12.终身学习:具有自主学习和终身学习的意识,有不断学习和适应发展的能力。
12.1能够认识不断探索和学习的必要性,具有自主学习和终身学习的意识。
12.2具有自主学习的能力,包括对技术问题的理解能力,归纳总结的能力和提出问题的能力等。
四、课程体系
数据科学与大数据技术专业课程体系如图1所示。
图1 数据科学与大数据技术专业课程体系
1.专业核心课程
程序设计基础、数据结构、面向对象原理与Java实践、Python语言程序设计、操作系统原理、计算机网络、数据库原理、离散数学、概率论与数理统计、机器学习、Hadoop大数据技术、数据采集与预处理、数据挖掘技术、软件工程。
2.主要实践教学环节
程序设计基础综合实训、数据结构综合实训、面向对象原理与Java实践综合实训、Python语言程序综合实训、数据库系统综合实训、Hadoop大数据技术综合实训、数据预处理综合实训(复杂实操型)、数据挖掘技术综合实训、流式数据处理综合实训、专业综合项目开发实训(生产实习)、创新实践周、毕业实习、毕业设计。
五、师资队伍
目前数据科学与大数据技术工程专业有教师11名,其中专业教师9名,实验教师2名。所有教师都具备硕士及以上学历,具有博士学位的教师5人,教授、副教授3人。所有教师的最高学历都是信息类学科,如计算机应用、软件工程、智能控制等。
六、教学条件
目前数据科学与大数据技术专业有大数据专业实验室、硬件实验室和软件实验室。大数据实验室可完成大数据技术、数据采集与预处理、数据挖掘、流数据处理等课程的实验教学;硬件实验室可完成相关硬件课程的实验教学,如计算机组成原理等;软件实验室可完成软件开发类的实验教学,如数据结构、数据库系统、面向对象编程等。
教学设备较为齐全,各实验室PC机的数量都能满足日常教学需要,另外有大数据实验平台系统、大数据开发设备等。
本专业现有实习基地多个,茂名市范围的有3个单位,珠三角范围有2个单位。