当前位置:手机游戏 > 手游资讯 > 游戏攻略 > [老师画像]对外经济贸易大学:用大数据描绘“教师画像”

[老师画像]对外经济贸易大学:用大数据描绘“教师画像”

作者:佚名 来源:哪吒游戏网 2019-10-27 15:13:31

[老师画像]对外经济贸易大学:用大数据描绘“教师画像”,哪吒游戏网给大家带来详细的[老师画像]对外经济贸易大学:用大数据描绘“教师画像”介绍,大家可以阅读一下,希望这篇[老师画像]对外经济贸易大学:用大数据描绘“教师画像”可以给你带来参考价值。

老师画像_我想画老师的画像_老师画像

随着互联网和大数据技术的发展,人们可以通过网络获取到用户的海量数据,通过对海量数据进行多维度的数据分析,能够实现精准快速地分析用户的特征和行为习惯。用户画像(UserProfile)的概念应运而生,它完美地抽象出一个用户的信息全貌。用户画像应用到学校的信息化环境中,催生出了“教师画像”的概念。“教师画像”是通过对学校信息化系统和校园网数据分析教师的数据信息,将教师“数据化”,本研究中的“教师画像”均基于此概念。

职业发展是个人在自我认知的基础上,对决定个人职业发展的主客观因素进行分析,并结合个人发展和组织发展的双重需要,确定职业发展目标、规划职业发展的各个方面,根据目标的实现程度,不断反馈和调整,最终实现既定目标的过程。合理的职业发展规划对教师的发展尤其重要,其职业发展发展如何,决定了教师的生命质量和教育质量。“教师画像”通过分析挖掘教师个人信息中的知识与规律,创新研究教师职业发展的路径,教师在自我认知的数据分析基础之上,制定个人的职业发展规划。

特征工程理论

特征工程是机器学习领域的一个重要概念,目前并没有普遍接受的定义,一般可以认为是为机器学习应用而设计特征集的相关工作。在机器学习领域,特征是用于预测的一种独立的、可描述的、可测量的属性,在结构化的数据表中,数据由不同的变量或者属性构成,这里的属性其实就是特征,但与属性一词不同的是,特征是对于分析解决问题有用的、有价值的、有意义的属性。选择合理的、全面的、信息量足够大的、有差别性的特征是机器学习的关键步骤。

特征工程的本质是一项工程活动,其目的是用目标问题所在的特定领域知识或者自动化的方法从原始数据中提取或生成特征,以供机器学习所使用。

基于特征工程构建“教师画像”

构建教师画像的核心工作是为教师打标签,打标签的目的是为了用数据描述人物,方便人们理解,并且能够让计算机进行处理。标签可以看做特征的一种表现方式,因此,教师画像比其他的机器学习更加依赖特征工程,利用特征工程来提取教师这些“标签化”的特征。在提取“标签化”特征的过程中,模型和算法的选择非常重要,合适的模型和算法更能够逼近真实的特征。

教师画像的特征提取和预处理

1.数据采集

本研究的原始数据提取主要来自业务数据、用户日志数据、网页公开数据爬取等方式。来自学校业务系统的数据一般都是存在MySQL、Oracle、SQlserver等数据库中,比如教师的基本属性、专业技能、奖励荣誉、培训进修等数据来自学校人力资源管理系统,科研成果来自科研管理系统,教学成果来自教务管理系统;上网行为来自校内网络日志数据,记录用户的浏览搜索等行为;消费数据、阅读偏好数据来自对主流互联网平台的公开数据的爬取。

我想画老师的画像_老师画像_老师画像

2.数据清洗

数据清洗主要解决原始数据的异常数据、重复数据、缺失数据和不规范数据。

(1)数据类型检查

原始数据里的数据类型可能有很多不一致的,比如出生日期,有的是字符串类型,有的是日期类型,需要转换成同一类型或者从身份证号里截取。比如年龄,有的是数值类型,有的是字符串类型,可以根据身份证号来计算,并设置成同一类型。

(2)缺失值处理

原始数据存在大量缺失值,有很多重要属性数据的缺失,改变了原始数据的真实有效性,对数据模型的效果存在很大的影响,因此,需要对缺失值进行处理,本研究采用了人工干预的方法和机器学习的插补方法,人工干预主要应用在业务系统数据上,教师的基本属性、科研成果、教学成果、奖励荣誉等信息存在缺失值时,进行人工补录;机器学习的插补方法主要应用在无法进行人工补录的业务系统数据、用户日志数据和网页公开爬取的数据上,插补方法多数采用均值插补或多重插补。

(3)异常值分析过滤

异常值分析过滤是分析检查原始数据中是否有错误数据或者不合理数据,如果有,需要对这些数据进行处理,不重要的属性可以删除,重要的属性要进行修改。常见的异常值分析过滤的方法有简单统计量分析法,设定数据值的范围,如果超过了最大值和最小值的范围,即判定为异常值,例如在职教师的年龄,设定最大值为65,最小值为20,超过这一数值范围的即判定为异常,筛选出来后进行相应的处理。

还有一种异常值分析过滤方法为正态分布3σ原则,正态分布又名高斯分布,曲线以x=μ为对称轴,σ代表标准差,μ代表均值,3σ原则为:数值分布在(μ-σ,μ+σ)中的概率为0.6826老师画像,数值分布在(μ-2σ,μ+2σ)中的概率为0.9544,数值分布在(μ-3σ,μ+3σ)中的概率为0.9974,分布在(μ-3σ,μ+3σ)区间外的取值概率不到0.3%。可以认为凡分布在(μ-3σ,μ+3σ)区间外的数值,就属于异常值,应予以剔除。该方法仅局限于对正态或近似正态分布的样本数据处理。

(4)特殊字符处理

老师画像_我想画老师的画像_老师画像

原始数据的某些字段中包含空格、换行符、制表符等特殊字符,这些特殊字符会影响到数据统计分析,因此有必要清洗掉这些字符。

3.数据预处理

数据预处理是对原始数据里面的脏数据进行处理,这些脏数据会极大地影响最后模型的效果,所以数据预处理是非常重要的一个步骤。数据预处理包括数据集成、数据变换、数据归约等。

教师画像特征选择

标签是特征空间中的维度,是特征的一种呈现方式,因此,我们利用特征工程来提取这些“标签化”的特征。

特征分为直接特征和间接特征,直接特征是一些显而易见的,能够直接从信息系统获取到,比如教师的性别、年龄、民族、政治面貌、籍贯、学历、学位、研究方向、科研成果等。而间接特征是从直接特征或者各种数据组合里计算推导出来的,可能需要复杂的模型计算,比如阅读偏好、科研偏好、消费偏好、运动偏好等。

以阅读偏好特征的生成为例,根据图书分类可将阅读偏好类型分为经济类、文化类、艺术类、语言文学类、历史地理类、科学类、教育类、工业技术类等,值处理为1、2、3、4、5、6、7、8,样本数据选择性别、年龄、研究方向、讲授课程、研究成果、借阅图书类别、购买图书类别等7个内容,每个样本用一个多维向量来描述,x=[x1,x2,x3,x4,x5,x6,x7],其中x1=性别,x2=年龄,x3=研究方向,x4=讲授课程,x5=研究成果,x6=借阅图书类别,x7=购买图书类别。采样足够多的样本数据构造训练集,样本数据集规模要足够大,一般情况下,数据集规摸越大,机器学习的效果越好,通过监督式学习(Supervised learning)对训练集进行学习,学习出“阅读偏好”的相关变量,得出阅读偏好特征,并把该特征作为标签输出。

总结:以上内容就是针对[老师画像]对外经济贸易大学:用大数据描绘“教师画像”详细阐释,如果您觉得有更好的建议可以提供给哪吒游戏网小编,[老师画像]对外经济贸易大学:用大数据描绘“教师画像”部分内容转载自互联网,有帮助可以收藏一下。



上一篇: [老师画像]阳光喔官网,阳光喔作文

下一篇: [老师画像]给老师画像 400字以上

本文标签: 老师画像 老师画像 我想画老师的画像
猜你喜欢