矩阵补全的算法(矩阵补全原理)

本文介绍的是ICLR2020入选论文《INDUCTIVEMATRIXCOMPLETIONBASEDONGRAPHNEURALNETWORKS》(基于图神经网络的归纳矩阵补全)。文章来自华盛顿大学圣路易斯分校博士、FacebookAI研究院研究科学家张牧涵。 文|张牧涵 编|丛末 下载链接:https://openreview.net/pdf?id=ByxxgCEYDS 代码地址:https://g…

文中详细介绍的是ICLR2020当选毕业论文《INDUCTIVE MATRIX COMPLETION BASED ON GRAPH NEURAL NETWORKS》(根据图神经网络的梳理矩阵补全)。文章内容来源于华盛顿大学圣路易斯校区博士研究生、Facebook AI 研究所科学研究生物学家张牧涵。

文 | 张牧涵

编 | 丛 末ICLR 2020 | 超越传统,基于图神经网络的归纳矩阵补全

下载地址:
https://openreview.net/pdf?id=ByxxgCEYDS

编码详细地址:
https://github.com/muhanzhang/IGMC

1 摘 要

矩阵补全(Matrix Completion)被广泛运用于推荐算法中。传统式的矩阵溶解(Matrix Factorization)方式为转导推理模型(Transductive Model),所学习培训到的embedding不可以营销推广到练习集中化未发生过的客户(user)和产品(item)。而 Inductive Matrix Completion (IMC) 实体模型应用內容信息内容(content)来补全矩阵,缺陷是对信息的产品质量标准很高,且在內容品质不行的情形下能造成远小于矩阵溶解的性能。

文中提起一种新的Inductive Graph-based Matrix Completion (IGMC) 实体模型,在维持归纳推理(inductive reasoning)的与此同时,彻底不依靠一切內容信息内容。能不依靠內容信息内容达到归纳推理的窍门就取决于子图构造。IGMC为每一个(user, item) pair获取一个包括子图(enclosing subgraph),并且用图神经网络(graph neural network)练习一个由子图构造投射到消费者对产品得分(rating)的回归分析。

IGMC在好几个数据上获得了最现代化的性能;它不但可以适用没在练习集中化发生的客户和产品,更可以转移(transfer)到新数据上。大家应用一个在MovieLens上练习的IGMC实体模型去预测分析豆瓣电影评分,获得了很好的性能,乃至好于很多专业在豆瓣网数据信息上练习的实体模型。

2 动 机

只需大家把每一个user或item当做一个节点(node),每一个rating当做一个边(edge),则矩阵补全可以看成是在二分图(bipartite graph)上的链接预测分析(link prediction)问题。有别于传统式链接预测分析只关心预测分析存有性(link existence),这儿我们要预测分析链接的值(link value),也就是客户对宝贝的得分。

最先,大家界定包括子图(enclosing subgraph)。对一个(user, item) pair,他们的h阶包括子图是由该user、 item,全部该user、 item的h-hop内临接节点(包括h-hop),及其全部这种节点中间的边构成的图。那样的一个包括子图内存有很多针对预测分析得分有效的信息内容。举例来说,即使仅用一阶包括子图,大家还可以得到例如客户均值得分、产品均值得分、产品总计点评频次,及其很多的根据途径(path)等的构造信息内容。参与图一。

一个简便的根据途径的结构类型如下所示,倘若大家想要知道客户u0针对产品v0的得分,大家能看有多少和u0品位类似的客户u1对v0打高分数;而品位类似可以用是不是这一u1和u0以前都给某一其他的产品v1打了高分数。汇总出来,那样的一个途径特点即是:ICLR 2020 | 超越传统,基于图神经网络的归纳矩阵补全

我们可以根据查有多少那样的途径来估计u0是不是会给v0高分数。并且,全部那样的途径都被包括在一阶包含子图(1-hop enclosing subgraph)中。ICLR 2020 | 超越传统,基于图神经网络的归纳矩阵补全

大家坚信相近那样的结构类型不计其数。因而,与其说手动式界定很多那样的研讨式特点(heuristics),比不上立即将一阶包括子图键入给一个图神经网络,用图神经网络强劲的图特点自学能力来全自动学习培训更通用性的、更有语言表达能力的特点。大家应用图神经网络练习一个由包括子图投射到得分的回归分析,试验证实,这类新的方式可以精准地预测分析得分。

3 方 法

获取每一个包括子图后,大家第一步要对这其中的节点开展标明(node labeling)。目地是为了能区别子图中节点的差异人物角色。例如我们要区别总体目标节点(target user/item)和环境节点 (context nodes)。总体目标节点标示出大家究竟要预测分析子图中哪一对(user, item)中间的得分。与此同时,我们可以区别不一样阶的隔壁邻居节点,例如一阶隔壁邻居(1-hop neighbors)和二阶邻居(2-hop neighbors)对总体目标节点的奉献水平并不相同。

大家选用了一个简便的作法,对总体目标客户(target user),大家标明为0,对总体目标产品(target item),大家标明为1;对i-hop的环境客户大家标明为2i,对i-hop的环境产品大家标明为2i 1。以后,大家将这种标明转换为one-hot encoding vector,做为每一个节点的原始特点键入给图神经网络。

在图神经网络(GNN)中,大家选用relational graph convolutional operator (R-GCN)做为卷积层,由于R-GCN可以从边种类中学习培训。ICLR 2020 | 超越传统,基于图神经网络的归纳矩阵补全

在其中,意味着节点在第层的矩阵的特征值, 和 为可学习培训的主要参数,意味着rating(一般从 中挑选,意味着与节点以种类边相接的隔壁邻居节点。

双层卷积神经网络后,大家将每一层結果相接获得每一个节点的最后表明:ICLR 2020 | 超越传统,基于图神经网络的归纳矩阵补全

最终,大家取总体目标客户和总体目标产品的相接的表明做为这一包括子图的最后表明:ICLR 2020 | 超越传统,基于图神经网络的归纳矩阵补全

并练习一个双层神经元网络(MLP)从子图表明重归到总体目标得分(rating)。

4 试验結果ICLR 2020 | 超越传统,基于图神经网络的归纳矩阵补全

大家仅应用一阶包括子图练习IGMC。最先,在Table 2中大家呈现了在Flixster, Douban和YahooMusic上的RMSE性能。大家的IGMC实体模型获得了state-of-the-art性能,超出了最近的别的根据图神经网络的实体模型。ICLR 2020 | 超越传统,基于图神经网络的归纳矩阵补全

在Table 3中大家展现IGMC在ML-100K 和 ML-1M上的性能。在ML-100K上,IGMC获得了较好的性能,和以前领跑的一种转导实体模型GC-MC性能同样。可是留意,GC-MC应用了另外的內容(content)特点,而IGMC彻底借助子图构造。GC-MC在没有应用content的情形下RMSE为0.910。在ML-1M上,IGMC仍滞后于别的一些转导逻辑推理的方式。大家下面深入分析这一问题。ICLR 2020 | 超越传统,基于图神经网络的归纳矩阵补全

针对ML-1M数据,大家各自将练习矩阵稀少为0.2, 0.1, 0.05, 0.01和0.001倍。Figure 2较为了GC-MC和IGMC在不一样稀少水平下的性能比照。大家发觉,尽管IGMC在sparsity=1时落伍于GC-MC,可是此后IGMC在不一样sparsity下都好于GC-MC,并且矩阵越稀少,性能优点越显著。大家猜想,根据子图特点学习培训的IGMC对稀少矩阵更鲁棒性;而根据矩阵溶解等的转导实体模型必须矩阵比较高密度(dense)才可以有好的性能。这也暗示着了IGMC在数据信息稀少的推荐算法中的发展潜力。ICLR 2020 | 超越传统,基于图神经网络的归纳矩阵补全

最终,大家检测IGMC的迁移学习性能。大家可以直接将ML-100K上练习的IGMC实体模型用以预测分析Flixster, Douban和YahooMusic。出乎意料,转移的IGMC实体模型获得了极高的性能,乃至好于一些专业在这里三个数据上练习的实体模型。这表明,不一样强烈推荐每日任务共享资源了很多同样的子图方式。ICLR 2020 | 超越传统,基于图神经网络的归纳矩阵补全

为认证这一点,大家数据可视化了一些现实的包括子图,见Figure 3。可以发觉,高得分和低评分相匹配的包括子图的确拥有非常明显的不一样;且不同数据中间共享资源很多类似的子图方式。

5 总 结

文中指出了一种根据子图特点开展归纳推理(inductive reasoning)的矩阵补全实体模型,IGMC。

根据这篇文章大家说明了仅从一阶包括子图学习图特点就可以在很多数据上做到领跑的性能,这好像暗示着更高级的联接关联并没尤其多的附加使用价值。

除此之外,大家也证实了不凭借內容(content)的inductive matrix completion (IMC)方式是一样有效的且大大超越了传统式的依靠內容的IMC方式。IGMC的很多特点,例如热敏性、稀少可扩展性等都暗示着了它的强悍发展潜力。大家期待IGMC能为引流矩阵补齐和推荐算法行业提供新的看法和启迪。

此外,依靠子图特点的链接预测分析方式早已取得了很大的取得成功,参照大家的另一篇文章“Link Prediction Based on Graph Neural Networks” :

http://papers.nips.cc/paper/7763-link-prediction-based-on-graph-neural-networks.pdf

ICLR 2020 系列产品毕业论文讲解

0、ICLR 2020 大会动态性报导

新冠疫情比较严重,ICLR2020 将举行虚似大会,非州初次 AI 国际性顶会从此泡汤

新冠疫情危害,ICLR 忽然改成网上方式,2020年将变成顶会转型之时吗?

受欢迎的图人工神经网络,ICLR 2020上有什么科学研究发展趋势?

1、直播间

回看 | 华为公司诺亚方舟ICLR100分毕业论文:根据强化学习的因果关系发觉

2、Oral

01. Oral | 一种镜像文件生成式翻译机器实体模型:MGNMT

02. Oral | 附加高斯函数先验总体目标,减轻负多元性愚昧

03. Oral | 引进附加自动门计算,LSTM稍做改动,性能便媲美Transformer-XL

04. Oral | 并行处理蒙卡树检索,性能高质量,线形加快,独闯「开心消消乐」1000关!

05. Oral | 元强化学习迈入一盆凉水:不比元Q学习好是多少

06. Oral | 用群卷积创建深层、等变的胶囊网络

07. Oral | Google发布分布式系统强化学习架构SEED,性能“强过”IMPALA,可拓展数千台设备,还很便宜

3、Spotlight

01. Spotlight | 实体模型主要参数这么多,泛化能力为什么还能那么强?

02. Spotlight | 公平与精准一样关键!CMU明确提出学习培训公平表现方式,完成优化算法公平

03. Spotlight | 组成泛化能力很差?用深度神经网络结合组成求得器试一下

04. Spotlight | 加快NAS,仅用0.1秒进行检索

05. Spotlight | 华盛顿大学:图像分类中对可完成进攻的防御力(短视频讲解)

4、Poster

01. Poster | 华为公司诺亚:恰当观念,NAS与「抵抗」融合,速度提升11倍

02. Poster | 撇开卷积,双头自专注力可以表述一切卷积实际操作

03. Poster | NAS 真的很难,百度搜索媲美任意取样!华为公司得出 6 条提议

04. Poster | 清华大学提 NExT 架构,用「神经细胞实行树」学习培训可实证性

05. Poster | Google全新科学研究:用“复合型散度”量化分析实体模型生成泛化能力

06. Poster | 完爆 BERT,Google最好 NLP 预训练模型开源系统,单卡练习仅需 4 天

07. Poster | FSNet:运用卷积核概述开展深层卷积神经元网络的缩小

08. Poster | “同歩均值课堂教学”架构为无监督学习给予更鲁棒性的伪标识

09. Poster | 迅速神经元网络响应式技术性

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

(0)
上一篇 2022年5月4日 上午10:05
下一篇 2022年5月4日 上午10:07

相关推荐

  • 千元手机性价比排行榜(最值得买的手机推荐)

    岁末年初,除旧迎新之际,各大手机厂家也开始纷纷促销降价,可以说是最适合换机的时间。今天就来推荐四款性价比超强的手机,都不过两千元,却一个比一个能打。 RedmiNote10Pro 红米作为最富有“性价比之王”盛名的手机,去年发布这款RedmiNote10Pro可谓性能大大越级。搭载天玑1100芯片,拥有超大面积的VC液冷面积散热模组,跑分轻松破67万。采用了一块6.6英寸的LCD屏,支持六档刷新率…

    2022年5月10日
    1280
  • thinkphp最新版本是什么,thinkphp开发工具及搭建教程

    点击右上方,关注开源中国OSC头条号,获取最新技术资讯 5.2在经过几个月的测试版本迭代后,正式进入候选版本。之后的重点工作会是扩展以及文档的完善。当然,不排除核心还有微调的可能。 ThinkPHP5.2RC1版本继上个版本beta3版本发布以来,主要更新如下: 新特性 支持FIND_IN_SET查询 增加了新的查询表达式对FIND_IN_SET的支持,使用下面的查询即可: Db::name('u…

    2022年6月15日
    1020
  • lol游戏加速器哪个好用(无需实名认证免费加速器)

    LOL英雄联盟的夏季赛正在如火如荼的进行中,7月27日,晚间IGvsTES的忍界大战在2天的延期后,终于正式开启,最终IG以2:0的比分战胜TES;其中TheSky的塔姆重新上演天神下凡,为IG的取胜插下了定海神针。 LOL英雄联盟已经上线十几个年头了,其热度依然不减,而且已经成为电竞赛事中人气最高的游戏。而LPL中国赛区已然成为了LOL英雄联盟当之无愧的第一赛区。所以吸引着很多身处海外地区的留学…

    2022年5月13日
    960
  • 关于网络营销的论文,网络营销你了解多少

    网络营销就是以国际互联网为媒体,利用数字化的信息和网络媒体的交互性来辅助营销目标实现的一种新型的市场营销方式。简单的说,网络营销就是以互联网为主要手段进行的,为达到一定营销目的的营销活动。 网络营销具有传统营销根本不具备的许多独特的、十分鲜明的特点。网络营销具有那些主要特点呢? 具有鲜明的理论性 网络营销是在众多新的营销理念的积淀、新的实践和探索的基础上发展起来的。网络营销理念吸纳了众多新的营销理…

    2022年5月19日
    700
  • 做公司网站需要准备什么,制作网站必备四点技能

    做网站容易,做一个营销型的好网站可就不容易了,如果企业做网站,大都会找一些当地的做网站公司,这时候我们就要了解这些做网站公司应该有的技能,只有具备了以下四点技能,才能做好企业网站,下面请随一诺做网站公司来了解一下做网站公司要具有四点技能吧! 一、网站质量及售后保证 有必要有一支完整的网站制作团队,并且建站技能过硬,网站建设价格合理,不管是图片处理,版面设计照常网站功用,能彻底满足客户需求。一起能重…

    2022年5月21日
    610
  • 高速固态硬盘哪个好(推荐三款性价比最高的固态硬盘)

    要说工作时遇到什么最让人烦心,卡顿和长时间的等待肯定排得上号。当你在脑海规划好了工作安排,正准备大干一场时,电脑突然的卡顿会立马浇灭你的热情。想要摆脱电脑卡顿,避免等待时间比工作时间还要长的解决办法其实很简单,一块可靠的高速SSD就可以了。SSD拥有比机械硬盘快几十倍的4K读写速度,让电脑的反应更加灵敏,下面就给大家推荐几款性价比高又靠谱的高速硬盘。 金士顿480GBSSD固态硬盘SATA3.0接…

    2022年10月23日
    2460
  • 旅行鞋什么牌子的好(公认最舒服的旅游鞋)

    现在的我们,拥有着众多诸如中秋、国庆这样的小长假。而在类似于大冰这样的理念熏陶下,我相信很多的人都会爱上旅游,并提早计划好自己的出游计划。然而在旅游过程中,一双耐磨舒适的跑鞋则是必不可少的。 那么无论是选择去登高望远,爬山涉水;还是愿意偏隅一方,选择一个静静的田园来安顿心灵。既然是旅行,一双好的鞋子就必不可少。众所周知,一双适合自己的鞋子对于一个“在路上”的人是多么重要。舒适的脚感可以让你奔波一天…

    2022年10月24日
    1050
  • 电脑服务器500错误的原因(服务器出问题解决方法)

    出现500错误的原因是很多的,一般来说,如果程序有问题,那么在浏览器中会返回给用户一个友好的错误提示,统一称之为服务器500错误。解决方法就是您必须在http中能够获得正确的错误提示信息。 方法为:请打开控制面板–internet选项–高级–"显示http友好错误提示",请取消该复选框,这样您就可以获得正确的错误提示。在获得正确的错误提示之后,您就可以根据该错误提示检查您具体的出错原因了。根…

    2022年5月13日
    880
  • pdf阅读器哪个好用,推荐3款免费实用的pdf阅读器

    虽然如今我们最常用的还是Word、Excel等Office文件,但是PDF文件如今也逐渐的开始流行起来,也成了我们经常使用的文件之一了。我们知道PDF文件需要借助PDF阅读器才能够打开的,那么什么样的PDF阅读器好用的呢?接下来,我为大家推荐几款好用的绿色版PDF阅读器。 一、轻快PDF阅读器推荐星级:★★★★★ 我相信大多数小伙伴都应该了解这款轻快PDF阅读器,就连我也经常在使用这款PDF阅读器…

    2022年10月11日
    2690
  • 广告文案案例分析,如何做好一个优秀的广告文案作品

    做广告文案和其他的写作方式是不同的, 也许一个作家需要的不断的扩充自己的写作内容,更多的去表述去陈述故事的发展,情节的推动,而做广告文案更像是要写一首诗,而且这首诗歌也许只有一两句。 所以更像是一个哲学系诗歌!不知道我形容的足够形象么? 世界上很多经典的广告语,很多家喻户晓的广告语都来源自广告人,如果一个广告文案的创意能够得到认可,那么无疑这个广告创意人是非常成功的,刚入行广告业的小白如何走出逆袭…

    2022年5月20日
    600

发表回复

登录后才能评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信