信息工程学院召开学术活动月讲座
信息来源:信息工程学院|发布时间:2018-05-15|文:徐长波
随着北京印刷学院第三届研究生学术活动月的开幕,信息工程学院于5月9日下午,在教B楼316进行关于《基于开源框架的大数据机器学习》的讲座。河北大学翟俊海教授应邀为信息学院全体研究生作报告。信息工程学院党委书记曹少中,教师徐长波、杨彦红和研究生代表20余人参加了学术交流会。曹少中主持交流会。
讲座现场
翟俊海主要介绍了大数据及其5V特征、大数据开源平台Hadoop和Spark、大数据机器学习及基于MapReduce的两类非平衡大数据集成分类。他通过四个部分详细介绍了大数据的基本信息。前三部分简介相关概念及大数据平台,并对大数据机器学习研究的主要挑战及可能的解决方案进行了简单的综述。第四部分重点介绍一种两类非平衡大数据集成分类方法,包括基于异类最近邻超球的上采样,构造平衡数据集、训练基本分类器,用模糊积分集成训练好的基本分类器,并用于数据分类。
翟俊海作报告
讲座结束后同学们与翟俊海进行了交流,纷纷提出在学习算法中遇到的问题,以及如何合理应用大数据。翟俊海积极地跟大家分享自己的经验,使大家获益匪浅。