由于推荐系统开放性的特点,恶意用户可以通过注入伪造的用户概貌以改变目标项目在推荐系统中的排名,托攻击行为干扰了推荐系统的正常运行,阻碍推荐系统的应用和推广。
《推荐系统中基于目标项目分析的托攻击检测研究》提出了几种托攻击监测的方法:提出一种基于目标项目分析的托攻击检测框架;在基于目标项目分析的托攻击检测框架基础上提出了两种托攻击检测算法;提出了一种结合目标项目分析和支持向量机的检测方法;提出了一种基于目标项目分析和时间序列的托攻击检测算法。
个性化推荐技术作为一种解决信息超载问题最有效的工具,但是由于推荐系统开放性的特点,恶意用户可以通过注入伪造的用户概貌以改变目标项目在推荐系统中的排名,此类现象称为托攻击。托攻击行为使推荐系统向用户推荐被操纵的商品或信息,干扰了推荐系统的正常运行,阻碍推荐系统的应用和推广。本书的主要内容如下:
分析了推荐系统国内外研究现状和面临的主要挑战;分析推荐系统中相似度计算方法、托攻击检测评价指标和现有的用于托攻击检测的概貌属性,并对推荐系统中概貌属性提取技术进行分析。
针对托攻击群体性特征以及用户评分矩阵稀疏性的特点,提出一种基于目标项目分析(TIA)的托攻击检测框架。首先,找出有攻击嫌疑的疑似托攻击用户集合;其次,构建由这些疑似托攻击用户概貌组成的评分矩阵;最后,通过目标项目分析方法得到攻击意图和目标项目,检索出托攻击用户。
通过分析真实用户概貌和托攻击用户概貌属性值的分布,在基于目标项目分析的托攻击检测框架基础上提出了两种托攻击检测算法,基于RDMA和DegSim概貌属性的方法(RD-TIA)和基于一种新的概貌属性DegSim‘的检测方法(DeR-TIA)。
针对现有的SVM托攻击检测算法存在的缺陷以及推荐系统托攻击检测中存在的类不均衡问题,本书提出了使用自适应人工合成样本方法Borderline-SMOTE来缓解类不均衡问题。提出了一种结合目标项目分析和支持向量机(SVM)的检测方法(SVM~TIA)。
根据虚假用户恶意注入的评分信息在时间节点上具有集中性的特点,以及真实评分与托攻击评分在统计学上呈现的不同分布特征,提出了一种基于目标项目分析和时间序列的托攻击检测算法(TS-TIA)。
本书受国家自然科学基金面上项目“基于异构服务网络分析的Web服务推荐研究”(No.61379158),国家自然科学基金青年基金项目“基于用户生成信息分析和异常群组发现的推荐系统托攻击检测研究”(No.61602070)等项目的资助。
本书的编写和出版受到了重庆大学软件学院的大力支持,在此表示衷心的感谢。
限于本书作者的学识水平,书中疏漏之处在所难免,恳请读者批评指正。
周魏,男,工学博士。国家建设高水平大学公派研究生项目-联合培养博士研究生。香港理工大学博士后。主要研究方向为推荐系统和数据挖掘。近年来。主持国家自然科学基金1项,参研国家自然科学基金3项。博士后基金1项,国家科技支撑计划课题1项,中央高校科研业务专项基金各1项,重庆市自然科学基金1项。以第1作者发表学术论文9篇,其中SCI检索期刊4篇。El检索8篇,计算机领域国际知名会议4篇,其中5篇为CCF推荐会议和期刊。文俊浩,男,重庆大学软件学院教授、博士生导师。近年来主要从事服务计算、数据挖掘等方面的研究。主持国家自然科学基金面上项目2项,主持国家“十一五”科技支撑计划项目1项,主研国家自然科学基金2项,主持并参与省部级项目10余项。2015年获国家教学成果二等奖(排名第2)。2014年获国家教学成果二等奖(排名第1),2013年获重庆市教学成果一等奖(排名第1),2011年获重庆市科技进步二等奖(排名第1)。近年来。发表学术论文70余篇,其中SCI检索20余篇,EI检索30余篇。
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 研究内容和创新点
1.4 本书组织结构
1.5 本章小结
第2章 推荐系统与推荐系统托攻击检测综述
2.1 推荐系统综述
2.2 推荐系统托攻击
2.3 推荐系统托攻击检测
2.4 概貌属性综述
2.5 本章小结
第3章 基于目标项目分析的推荐系统托攻击检测框架
3.1 问题的提出
3.2 推荐系统鲁棒性分析
3.3 目标项目分析方法
3.4 基于目标项目分析的托攻击检测框架TIAF
3.5 本章小结
第4章 基于概貌属性和目标项目分析的托攻击检测研究
4.1 基于概貌属性和目标项目分析的托攻击检测框架
4.2 RD-TIA托攻击检测方法
4.3 DeR-TIA托攻击检测方法
4.4 实验过程与结果分析
4.5 本章小结
第5章 基于支持向量机和目标项目分析的托攻击检测研究
5.1 问题的提出
5.2 相关理论
5.3 基于支持向量机和目标项目分析的托攻击检测
5.4 实验过程与结果分析
5.5 本章小结
第6章 基于时间序列和目标项目分析的托攻击检测研究
6.1 问题的提出
6.2 时间序列建模
6.3 基于目标项目分析和时间序列的托攻击检测框架
6.4 实验过程与结果分析
6.5 本章小结
第7章 结论与展望
7.1 主要结论
7.2 后续工作展望
参考文献
《推荐系统中基于目标项目分析的托攻击检测研究》:
①搜索引擎是指运用一定的策略,使用特定的程序对互联网上的信息资源搜集整理,对信息组织和处理后,供用户输入关键词查询的系统。它搜集并整理互联网上的信息并根据用户的查询关键词返回相应结果。搜索引擎不仅能够满足人们绝大多数的搜索需求,还可以按照用户的方式对搜索结果进行个性化排序。根据有关调查报告显示,截至2014年6月,中国搜索引擎用户数达到50749万人,较去年同期增长3711万人,增长率为7.9%。这表明搜索引擎已经逐渐融人人们的日常生活之中。
搜索引擎虽然在用户能提供明确需求时功能强大,但是它只能被动地向用户展示信息,无法主动地向用户提供服务,具有一定的局限性。同时对用户而言,将需求表达成一个或者几个合适的关键词是一个较大的挑战。例如,用户面对成千上万的音乐专辑时,往往难以找出符合自己兴趣音乐的关键词。此时搜索引擎难以提供有效的帮助,这就需要一个更为自动化的信息过滤工具帮助用户从庞大的音乐库中找到其感兴趣的音乐。另外,搜索结果的排序受到用户越来越多的关注,如何对搜索结果进行排序显得尤为重要,而竞价排名的出现,也成为搜索引擎被人诟病的原因之一。
②推荐系统是一种通过分析用户的历史行为信息、使用习惯等向用户主动推送信息的工具。电子商务是推荐系统的主要应用领域,在电子商务不断发展壮大的今天,各种商品信息在电子商务网站上不断涌现,用户往往需要花费大量的时间在各类商品信息中寻找自己想要的商品。推荐系统通过对用户的历史消费习惯、点击情况等信息进行分析,向用户呈现感兴趣的甚至是潜在感兴趣的商品,从而减少用户浏览无用信息的时间以帮助用户获得更好的购物体验,并且能够为电子商务站点带来更多的营业额。
推荐系统促进了电子商务的发展,同时电子商务的进一步发展依赖于推荐系统自身功能的完善。推荐系统需要用户大量的历史记录作为预测的依据,一般来说,用户提供的历史数据越多,推荐系统向用户推荐的结果就越准确。推荐系统管理者希望用户能够提供对项目真实的评价从而使推荐系统能够产生高质量的推荐服务,然而在现实中,恶意用户利用推荐系统评分驱动的工作机制与开放性的特点来谋求不正当利益。恶意用户向推荐系统中注入虚假评价信息以达到干扰推荐系统正常推荐的目的,其结果是损害正常用户的利益和推荐系统的信誉。例如在电子商务平台中,部分厂商为了销售更多的商品,向推荐系统注入虚假的评分信息或评论信息来提高商品在推荐系统中的排名;或者使用类似的方法打压竞争对手销售的产品,以此来提高自己商品的销量。现实生活中也不乏这样的例子:索尼影业公司就曾经伪造电影评论信息来宣传正在发行的电影;亚马逊网站曾遭到外来的攻击,当用户浏览与宗教相关的书籍时,系统会向用户推荐有关性方面的书籍。
为了减少虚假信息对于推荐系统的影响,推荐系统管理者探讨使用各种技术防御恶意程序的攻击。例如,实行实名制,审核系统用户信息,增加恶意用户向推荐系统中注入托攻击概貌的难度;使用验证码,增加恶意程序的攻击成本。然而,这些方法能阻止部分恶意程序,但同时也增加了正常用户使用推荐系统的难度,不利于推荐系统的扩展。
除了恶意程序对推荐系统的攻击之外,现实中还有专门提供托攻击服务的人群,被称为“网络水军”。例如手机软件公司为了推广自己开发的软件,通过雇佣网络水军来下载使用自己的软件,使得软件在软件排行榜上的名次上升,吸引更多的用户下载使用。网络水军的出现造成部分公司通过人为操纵下载量的方式长期占据软件排行榜前列导致了不公平竞争。
……