2012年6月26日,星期二

关于链接预测的思考

我正在读Richard等的论文。等来自 ICML 2012论文清单同时稀疏和低秩矩阵的估计。我不确定为什么直到现在我仍将这两个想法混为一谈,但回想起来,它们显然是不同的,并且可能要针对这两个进行优化。自从 潜在特征日志线性 Mennon和Elkan(LFLL)模型本质上是一种低阶矩阵分解算法,我想知道如何在其中同时执行稀疏性;我认为在潜在功能上使用$ L_1 $正则化函数可能值得尝试。

但是,这篇论文也让我思考了链接预测。这是这篇论文的引文:
链接预测 -矩阵$ A $是部分观测图的邻接矩阵;不存在和未发现的链接的条目均为0。搜索空间像以前一样不受限制,矩阵$ S $包含链接预测的分数;理想损耗函数是每个系数的零一损耗的经验平均值\ [
l_ {E}(S,A)= \ frac {1} {| E |} \ sum _ {(i,j)\ in E} 1 _ {(A_ {ij}-1/2)\ cdot S_ {ij} \ leq 0}。
\]
所以我读为,``这是一个 P-U问题 我们正在简化为逐点分类。'' 首选方法 对于P-U问题,是降低到排名(AUC损失)。链接预测会是什么样?
  1. 实例是边(即,成对的顶点加上二进位的特定信息)。
  2. 减少AUC是成对分类,即成对的边或成对的顶点。
  3. 邻接图中的每个正(观察)边都将与未标记(未观察或未开发)边配对,后者可能从所有可能的边上均匀地绘制;或可能从给定一个顶点的所有可能边缘开始(``每个顶点AUC'')。
  4. 最终的分类模型可以是纯粹的潜伏模型(例如,纯LFLL),也可以是纯粹由特征驱动的模型(例如,使用 大众)或组合(例如带有辅助信息的LFLL)。
    1. 根据我的经验,与纯粹的LLFL不同,带有辅助信息的LLFL很难训练。

下次我遇到链接预测问题时,我将稍作讨论。

2条评论:

  1. 这(具有针对AUC优化的潜在因子模型的链接预测)基本上就是我们所做的"our"(St.和Chr。完成了大部分工作)UAI 2009论文:隐式反馈的贝叶斯个性化排名。效果很好。 2011年KDD杯(第二场)的一些顶级球队也使用了它。

    回复删除