202410论文研读-GAT-LS: A Graph Attention Network for Learning Style Detectionin Online Learning Environment

作者:Wanying Suo, Bello Ahmad Muhammad, Zhichao Zhang, and Bo Liu
单位:
School of Computer Science, Shaanxi Normal University, Xi’an, Shaanxi,
School of Computer Science and Technology, Henan Institute of Science and Technology, Henan,
School of Information Science and Technology, Hainan Normal University, Haikou

1.背景

学习风格(LS)作为实现个性化教育的关键特征之一,成为个性化学习的核心因素。学习风格可以帮助学习者更好地识别自己的学习偏好,并帮助他们了解哪些学习方法和工具可以帮助更好地掌握知识。而对于教师而言,通过识别学生的学习风格,可以进行更好的个性化教学。

大多数现有方法严重依赖于特定的学习环境或教育系统,具有较差的可移植性,而我们需要根据学生的需求进行实时调整和优化。

为了克服这些限制,并受到图表示学习和注意力机制最近快速发展的启发,提出了一种用于在线学习环境中学习风格检测的新型图注意力网络(GAT-LS):学生与在线平台之间的交互数据被构建为一个二分图,节点特征用于增强数据的表示,然后构建不同的GAT模型来提取具有不同属性和规模的节点的隐藏特征,这些隐藏特征用于根据合适的学习风格模型对具有不同学习风格的学习者进行聚类。

2.方法

第一步,构建一个称为 S-M 图的二分图,特别关注他们与学习资源的动作和交互。指学生集合、学习材料集合及其基于学生与学习材料的动作和交互的数据的连接。

第二步,用GAT建立节点之间的连接,并评估邻近节点的不同重要性。这个过程将图编码为一个紧凑的表示,可以用于进一步的机器学习任务。

最后一步,利用每个 FSLSM 维度的潜在表示和映射特征来检测学习风格。通过聚类算法,帮助识别和分组具有相似学习风格的学习者。

A.S-M Bipartite Graph Construction

使用 0-1 矩阵来表示两个节点集合之间的连接关系,只要学生和学习材料之间存在交互即添加边。

根据数据集的特征和所选 GRL 模型的要求,为所有节点添加了额外的节点特征。向二分图添加节点特征可以提供上下文或完整的图信息作为附加信息,有助于更好地理解节点的意义和关系。

测量学生在与在线学习环境(OLEs)交互时访问学习材料的频率,获得一个固定长度的向量,表示交互信息。

其中S和M分别表示学生集合和学习材料集合。节点特征向量表示观察到的学生-材料记录数据,描绘了学生在学习过程中与学习材料的动作和交互。

B.Node Features Extraction

使用GAT对二分图进行节点特征提取,该模型由两部分组成:一部分使用多头注意力网络来提取学生节点的隐藏特征,另一部分则使用“drop-edge”机制和单层注意力网络来处理学习材料节点的特征。

使用三头注意力层,输出节点特征包含关于哪个邻居更重要的信息。此外,为了解决过度平滑问题,引入DropEdge机制,即在特征提取过程中随机删除一些边。基于此,材料节点特征提取模型由一个DropEdge层和两个单层图注意力层组成。

C.Learning Style Detetion

使用FSLSM(Felder-Silverman学习风格模型)作为学习风格检测的基础,将学习材料的向量映射到每个维度。

与每个FSLSM维度相关的材料节点潜在表示被提供给K-means聚类算法作为输入。

取  k = 2 ,因为在FSLSM模型中,每个类别的四个维度都被分为两个极点。

通过映射处理后,与每个FSLSM维度相关的材料特征被输入到K-means算法中。其结果可以解释为每个簇代表一组在向量距离上非常接近的学生。

3.实验及表现分析

首先用多头GAT来获取全图信息,获取每个学生节点与其邻居节点的重要性信息,然后对材料节点使用drop-edge机制和单层注意力层来提取其隐藏表示。

应用三头GAT,并设置0.2的dropout以防止过拟合,同时将leakyRelu的参数alpha设为0.2,确保在梯度更新过程中所有节点都有非零值。对于材料节点,在提取特征时,以p=0.7的概率随机删除一些边,设置leakyRelu的alpha为0.2,dropout率为0.5。

设置k=2,根据材料资源在每个FSLSM极端的映射来计算每个簇的中心值。K-means聚类算法将相似的向量紧密聚集,不同的向量归入不同的组中。

(1)模型效果

对于所有FSLSM维度,平均值分别为0.9647、0.9478、0.9171和0.9346。基于这些结果,显而易见,所提出的GAT-LS方法在应用于FSLSM四个维度的最终聚类结果时,在准确率、精确率、召回率和F1分数方面表现出色。

实验结果表明,GAT-LS方法具有较强的性能,能够有效地完成学习风格检测任务。

(2)对比评估

尽管在第一个维度上表现突出,准确率为0.9864,而GNN-LS方法达到了0.9657,但在其余三个维度和平均值上略低于GNN-LS。这种结果归因于GNN-LS进行了200轮高计算量的迭代,从而取得了更好的结果。

基于平均值可以明显看出,本文方法的平均精确率为0.9478,远高于表中列出的其他方法的精确率。

这表明所提出的方法性能优越,图形分析与注意力机制的集成在特征向量创建和标签生成过程中显著提高了学习风格检测的有效性。

GAT-LS方法在召回率和F1评分上优于现有方法,平均值分别为0.9171和0.9346。表明具有更好的效果和效率。

然而召回率相比于其他三个指标相对较低,仅为0.9171。这是因为数据集没有足够的特征供模型充分提取。

证明引入注意力机制使特征提取过程能够更加关注学习者对学习材料的偏好。

4.总结

核心内容:

本文的研究将学生与学习平台之间的互动信息抽象为一个带有节点特征的二分图。随后,采用图注意力网络(GAT)从学生节点和材料节点中提取特征。对于学生节点使用多头注意力,而材料节点则采用dropEdge机制和单层注意力网络以防止过平滑。最后,基于FSLSM模型应用K-means聚类进行学习风格检测。

对其思考:
(1)使用GAT进行节点特征提取,能够有效捕捉节点之间复杂的关系和交互。

(2)多头注意力机制对节点特征进行加权,可更好捕捉不同邻居节点的重要性。

(3)dropEdge机制可以有效解决常见的过平滑问题。