您好,欢迎来到好土汽车网。
搜索
您的当前位置:首页一种基于Embedding的实时个性化金融产品推荐算法[发明专利]

一种基于Embedding的实时个性化金融产品推荐算法[发明专利]

来源:好土汽车网
(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 CN 111681107 A(43)申请公布日 2020.09.18

(21)申请号 202010526015.7(22)申请日 2020.06.11

(71)申请人 黄锐

地址 510653 广东省广州市天河区力康路

雅居乐富春山居J46栋225房

申请人 唐松(72)发明人 黄锐 唐松 (51)Int.Cl.

G06Q 40/02(2012.01)G06K 9/62(2006.01)G06F 16/9535(2019.01)

权利要求书2页 说明书5页 附图2页

CN 111681107 A()发明名称

一种基于Embedding的实时个性化金融产品推荐算法(57)摘要

本发明公开了一种基于Embedding的实时个性化金融产品推荐算法,包括以下几个步骤:S1、银行通过业务系统采集用户的个人信息和近期资产评估情况;S2、训练集的构建,对用户的历史金融产品购买情况(浏览情况)构建训练集;S3、对数据集进行处理,采集负样本;S4、利用skip-gram分别对离线点击过的产品、实时点击的产品、候选产品进行Embedding训练;S5、根据Embedding训练结果在基于历史点击产品的基础上计算实时点击产品与候选产品之间的物品相似度,然后基于物品相似度计算出用户对候选产品的兴趣度,根据兴趣度的高低将产品推荐给客户;本发明基于大数据分析金融产品数据和用户数据,可以将不同类型的产品推荐给合适的人群。

CN 111681107 A

权 利 要 求 书

1/2页

1.一种基于Embedding的实时个性化金融产品推荐算法,其特征在于,包括以下几个步骤:

S1、银行通过业务系统采集用户的个人信息和近期资产评估情况;S2、训练集的构建,对用户的历史金融产品浏览情况构建训练集;S3、对数据集进行处理,采集负样本;S4、利用skip-gram分别对离线点击过的产品、实时点击的产品、候选产品进行Embedding训练;

S5、根据Embedding训练结果在基于历史点击产品的基础上计算实时点击产品与候选产品之间的物品相似度,然后基于物品相似度计算出用户对候选产品的兴趣度,根据兴趣度的高低将产品推荐给客户。

2.根据权利要求1所述的一种基于Embedding的实时个性化金融产品推荐算法,其特征在于:所述步骤S1中,用户的个人信息包括但不限于姓名、身份证号、年龄、职业、学历,所述近期资产评估情况包括但不限于客户近期资金进出账情况、客户信用度。

3.根据权利要求1所述的一种基于Embedding的实时个性化金融产品推荐算法,其特征在于:所述步骤S2中包括如下步骤:

S21:将每个用户点击过的金融产品构成一个数据记录集合;S22:按照点击的时间先后顺序进行排序;S23:过滤查看时长在30秒内的产品浏览记录;S24:将保留的浏览记录构造成训练集,其包括两个部分:一是有预定产品行为的预定记录,一种是没有预定行为的查看记录。

4.根据权利要求1所述的一种基于Embedding的实时个性化金融产品推荐算法,其特征在于:所述步骤S3中,所述负样本从客户没有浏览过的金融产品中进行随机抽取采样,且侧重于抽取不热门的金融产品。

5.根据权利要求1所述的一种基于Embedding的实时个性化金融产品推荐算法,其特征在于:所述步骤S4中对连续点击的产品记录,通过skip-gram算法,将每个用户连续点击查看的金融产品当成一个句子序列,其中的产品个体当作word,通过中间的产品去预测前后上下文的产品,训练出产品的Embedding。

6.根据权利要求5所述的一种基于Embedding的实时个性化金融产品推荐算法,其特征在于:所述步骤S4中,训练函数为:

其中,vl表示当前查看金融产品的向量,vc表示周围的金融产品的向量,l被称为中心节点,c被称为中心节点前后连续的节点;Rp表示正样本,Rn表示负样本,

表示新增的负样

本;不带'表示输入向量,带'表示输出向量;函数中第一项代表正样本的似然估计,第二项为负样本的似然估计,第三项为成交的金融产品的似然估计,第四项为对新增的负样本进行似然估计。

7.根据权利要求1所述的一种基于Embedding的实时个性化金融产品推荐算法,其特征在于:所述步骤S5中,包括如下步骤,

2

CN 111681107 A

权 利 要 求 书

2/2页

S51:对推荐的产品进行分类,并对推荐产品计算相似度;S52:将计算后相似度从高到低排序,取前5~10个金融产品推荐给客户。

8.根据权利要求7所述的一种基于Embedding的实时个性化金融产品推荐算法,其特征在于:所述步骤S51中,推荐产品一共包括两个类别,其中一个类别为用户最近一个月查看次数过的产品,为历史产品点击集合,用N(a)表示其Embedding集合;另外一个类别为用户实时点击过的产品,用N(b)表示该产品的Embedding。

9.根据权利要求8所述的一种基于Embedding的实时个性化金融产品推荐算法,其特征在于:所述步骤S51中,将候选产品与上述两种类别中的产品计算产品之间相似度以及用户对候选产品的兴趣度,计算公式为:

pui=α∑wiarua+β∑wibrub;

其中,其中N(i)表示候选产品列表,N(a)为近期一个月内点击的产品列表,N(b)表示用户实时点击的产品,N(i)∩N(a)表示候选产品与用户一个月内点击过的产品列表中相同的产品,N(i)∩N(b)表示候选产品与用户实时点击过的产品列表中相同的产品,wia、wib代表物品之间的相似度,pui用户u对候选物品i的兴趣度,rua、rub是用户对浏览过的产品的兴趣度,α、β分别表示历史点击产品和实时浏览产品对最终推荐结果的影响权重,其中α+β=1,α=0.3,β=0.7。

3

CN 111681107 A

说 明 书

一种基于Embedding的实时个性化金融产品推荐算法

1/5页

技术领域

[0001]本发明涉及计算机算法技术领域,具体为一种基于Embedding的实时个性化金融产品推荐算法。

背景技术

[0002]随着互联网的发展,传统金融行业受到冲击,以银行为代表的金融机构面临着营销方面的巨大挑战。每个客户在金融市场中愿意承受风险的意愿各不相同,对于银行等金融机构来说就需要根据不同客户的需求提供满足客户的产品和服务,而这些金融机构的人力物力资源有限,针对客户的推荐效果不明显,特别是一些潜在客户的流失问题尤为严重,这成为了金融机构亟待解决的问题。站在消费者的角度上来看,市面上的金融产品数目繁多,其质量和信用评价参差不齐,在金融市场的海量信息中筛选出符合自己兴趣和购买力的产品,用户需要进行多方面、度地数据分析,才能做出合理的产品选择。

[0003]Embedding指的是通过一个映射函数把X所属空间的物体映射为到为Y空间的向量,空间距离相近的Embedding向量对应有着相近的物体含义。skip-gram算法是指在对一个单词进行语义Embedding训练时,假设其中一个长度为T的句子为L1,L2,L3……LT,在指定一个中心词后我们关注的上下文数量为该中心词前m个词和后m个词,通过中心词去预测相对应的上下文词;本方案基于skip-gram算法,提出了一种基于Embedding的实时个性化金融产品推荐算法。

发明内容

[0004]本发明的目的在于提供一种基于Embedding的实时个性化金融产品推荐算法,以解决上述背景技术中提出的问题。[0005]为实现上述目的,本发明提供如下技术方案:

[0006]一种基于Embedding的实时个性化金融产品推荐算法,包括以下几个步骤:[0007]S1、银行通过业务系统采集用户的个人信息和近期资产评估情况;[0008]S2、训练集的构建,对用户的历史金融产品浏览情况构建训练集;[0009]S3、对数据集进行处理,采集负样本;[0010]S4、利用skip-gram分别对离线点击过的产品、实时点击的产品、候选产品进行Embedding训练;[0011]S5、根据Embedding训练结果在基于历史点击产品的基础上计算实时点击产品与候选产品之间的物品相似度,然后基于物品相似度计算出用户对候选产品的兴趣度,根据兴趣度的高低将产品推荐给客户。

[0012]作为本发明一种优选的技术方案,所述步骤S1中,用户的个人信息包括但不限于姓名、身份证号、年龄、职业、学历,所述近期资产评估情况包括但不限于客户近期资金进出账情况、客户信用度。

[0013]作为本发明一种优选的技术方案,所述步骤S2中包括如下步骤:

4

CN 111681107 A[0014]

说 明 书

2/5页

S21:将每个用户点击过的金融产品构成一个数据记录集合;

[0015]S22:按照点击的时间先后顺序进行排序;[0016]S23:过滤查看时长在30秒内的产品浏览记录;[0017]S24:将保留的浏览记录构造成训练集,其包括两个部分:一是有预定产品行为的预定记录,一种是没有预定行为的查看记录。[0018]作为本发明一种优选的技术方案,所述步骤S3中,所述负样本从客户没有浏览过的金融产品中进行随机抽取采样,且侧重于抽取不热门的金融产品。[0019]作为本发明一种优选的技术方案,所述步骤S4中对连续点击的产品记录,通过skip-gram算法,将每个用户连续点击查看的金融产品当成一个句子序列,其中的产品个体当作word,通过中间的产品去预测前后上下文的产品,训练出产品的Embedding。[0020]作为本发明一种优选的技术方案,所述步骤S4中,训练函数为:

[0021][0022]

其中,vl表示当前查看金融产品的向量,vc表示周围的金融产品的向量,l被称为中

心节点,c被称为中心节点前后连续的节点;Rp表示正样本,Rn表示负样本,表示新增的负样本;不带'表示输入向量,带'表示输出向量;函数中第一项代表正样本的似然估计,第二项为负样本的似然估计,第三项为成交的金融产品的似然估计,第四项为对新增的负样本进行似然估计。

[0023]作为本发明一种优选的技术方案,所述步骤S5中,包括如下步骤,[0024]S51:对推荐的产品进行分类,并对推荐产品计算相似度;[0025]S52:将计算后相似度从高到低排序,取前5~10个金融产品推荐给客户。[0026]作为本发明一种优选的技术方案,所述步骤S51中,推荐产品一共包括两个类别,其中一个类别为用户最近一个月查看次数过的产品,为历史产品点击集合,用N(a)表示其Embedding集合;另外一个类别为用户实时点击过的产品,用N(b)表示该产品的Embedding。[0027]作为本发明一种优选的技术方案,所述步骤S51中,将候选产品与上述两种类别中的产品计算产品之间相似度以及用户对候选产品的兴趣度,计算公式为:

[0028]

其中,其中N(i)表示候选产品列表,N(a)为近期一个月内点击的产品列表,N(b)表示用户实时点击的产品,N(i)∩N(a)表示候选产品与用户一个月内点击过的产品列表中相同的产品,N(i)∩N(b)表示候选产品与用户实时点击过的产品列表中相同的产品,wia、wib代表物品之间的相似度,pui用户u对候选物品i的兴趣度,rua、rub是用户对浏览过的产品的兴趣度,α、β分别表示历史点击产品和实时浏览产品对最终推荐结果的影响权重,其中α+β=1,α=0.3,β=0.7。

[0030]与现有技术相比,本发明的有益效果是:本发明,提供一种基于Embedding的实时个性化金融产品推荐算法,基于大数据分析金融产品数据和用户数据,通过求产品Embedding与历史点击产品以及实时点击产品之间的相似度获取用户对候选产品的兴趣度,从而有效的达到实时推荐的效果,这不仅解决了用户面对种类繁多的产品却无从下手

5

[0029]

CN 111681107 A

说 明 书

3/5页

的情况,同时也可以很好的帮助银行解决推荐数据稀疏的问题,提升银行推荐的准确性。附图说明

[0031]图1为本发明的流程示意图;

[0032]图2为本发明的Embedding向量训练示意图。

具体实施方式

[0033]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。[0034]请参阅图1-2,本发明提供一种技术方案:一种基于Embedding的实时个性化金融产品推荐算法,包括以下几个步骤:[0035]S1、银行通过业务系统采集用户的个人信息和近期资产评估情况;[0036]S2、训练集的构建,对用户的历史金融产品浏览情况构建训练集;[0037]S3、对数据集进行处理,采集负样本;[0038]S4、利用skip-gram分别对离线点击过的产品、实时点击的产品、候选产品进行Embedding训练;[0039]S5、根据Embedding训练结果在基于历史点击产品的基础上计算实时点击产品与候选产品之间的物品相似度,然后基于物品相似度计算出用户对候选产品的兴趣度,根据兴趣度的高低将产品推荐给客户。[0040]进一步的,所述步骤S1中,用户的个人信息包括但不限于姓名、身份证号、年龄、职业、学历,所述近期资产评估情况包括但不限于客户近期资金进出账情况、客户信用度。[0041]进一步的,所述步骤S2中包括如下步骤:[0042]S21:将每个用户点击过的金融产品构成一个数据记录集合;[0043]S22:按照点击的时间先后顺序进行排序;[0044]S23:过滤查看时长在30秒内的产品浏览记录;[0045]S24:将保留的浏览记录构造成训练集,其包括两个部分:一是有预定产品行为的预定记录,一种是没有预定行为的查看记录。[0046]进一步的,所述步骤S3中,所述负样本从客户没有浏览过的金融产品中进行随机抽取采样,且侧重于抽取不热门的金融产品。[0047]进一步的,所述步骤S4中对连续点击的产品记录,通过skip-gram算法,将每个用户连续点击查看的金融产品当成一个句子序列,其中的产品个体当作word,通过中间的产品去预测前后上下文的产品,训练出产品的Embedding。[0048]进一步的,所述步骤S4中,训练函数为:

[0049][0050]

其中,vl表示当前查看金融产品的向量,vc表示周围的金融产品的向量,l被称为中

6

CN 111681107 A

说 明 书

4/5页

心节点,c被称为中心节点前后连续的节点;Rp表示正样本,Rn表示负样本,表示新增的负样本;不带'表示输入向量,带'表示输出向量;函数中第一项代表正样本的似然估计,第二项为负样本的似然估计,第三项为成交的金融产品的似然估计,第四项为对新增的负样本进行似然估计。[0051]进一步的,所述步骤S5中,包括如下步骤,[0052]S51:对推荐的产品进行分类,并对推荐产品计算相似度;[0053]S52:将计算后相似度从高到低排序,取前5~10个金融产品推荐给客户。[00]进一步的,所述步骤S51中,推荐产品一共包括两个类别,其中一个类别为用户最近一个月查看次数过的产品,为历史产品点击集合,用N(a)表示其Embedding集合;另外一个类别为用户实时点击过的产品,用N(b)表示该产品的Embedding集合。[0055]进一步的,所述步骤S51中,将候选产品与上述两种类别中的产品计算产品之间相似度以及用户对候选产品的兴趣度,计算公式为:

[0056]

其中,其中N(i)表示候选产品列表,N(a)为近期一个月内点击的产品列表,N(b)表示用户实时点击的产品,N(i)∩N(a)表示候选产品与用户一个月内点击过的产品列表中相同的产品,N(i)∩N(b)表示候选产品与用户实时点击过的产品列表中相同的产品,wia、wib代表物品之间的相似度,pui用户u对候选物品i的兴趣度,rua、rub是用户对浏览过的产品的兴趣度,α、β分别表示历史点击产品和实时浏览产品对最终推荐结果的影响权重,其中α+β=1,α=0.3,β=0.7。[0058]具体的:在步骤S2中把每个浏览过的产品作为点击对话,并对对话进行排序、分割以及过滤删除,最终将浏览记录分成两种,以预定产品为终止条件的预定记录;不以预定产品为终止条件的浏览记录。步骤S3,从用户没有浏览过的金融产品中进行随机抽取采样,侧重于抽取不热门的金融产品,保证正负样本的数目相当。[0059]步骤S4,采用skip-gram方式来训练产品的Embedding,skip-gram方法源自于自然语言处理领域,原理是在每一个语料库中的句子上设置一个窗口,在给定窗口中的word,去预测上下文。

[0060]在本方案中把每个用户连续点击的金融产品视为一个句子,每个产品当作word,,以此训练出金融产品的Embedding。

[0061]

[0057]

具体的学习优化函数为;其中第一项

代表正样本的似然估计,第二项为负样本的似然估计;若考虑到点击序列是以成交行为作为序列结束的标志,则在上述公式中进行调整为:

[0062]

增加的第三项为成交的

金融产品的似然估计;当我们限定金融产品的类型,如设置当前选择范围为指数基金,则优化函数调整如下;

7

CN 111681107 A[0063]

说 明 书

5/5页

增的项为在用户搜索的范围内,采集一些负样本,如选择一些没有浏览过的指数基金作为负样本,对这些负样本进行似然估计。[00]步骤5中,根据Embedding训练结果计算当前选择产品与用户近期查看、收藏的金融产品的相似度,将排名靠前的金融产品推荐给客户,并将购买后的行为添加到训练集中;步骤S51中,将推荐产品分成两种,其中一个类别为用户最近一个月查看次数过的产品,为历史产品点击集合,用N(a)表示其Embedding集合;另外一个类别为用户实时点击过的产品,用N(b)表示该产品的Embedding集合;在浏览产品的时候设置一个评分标签用于收集用户偏好,用户可以为该产品选择喜欢/不喜欢的标签;利用公式计算出计算产品之间相似度,在获得物品相似度之后,我们通过结合历史推荐和实时推荐的协同过滤算法求出用户对候选物品的兴趣度,最终将计算出的兴趣度从高到低排序,取前5-10个金融产品推荐给客户,并将并将购买后的行为添加到训练集中。[0065]rua、rub是用户对浏览过的产品的兴趣度,设定假设用户选择产品的标签为“喜欢”,则值设置为1;标签为不喜欢时,值设定为0;α、β分别表示历史点击产品和实时浏览产品对最终推荐结果的影响权重,我们将值设定为α+β=1,将值设定为α=0.3,β=0.7,表示实时点击的产品对于最终推荐的结果影响更大,因此算法对离线推荐与实时推荐做一个结合,在考虑用户历史物品与待选物品之间相似度联系的基础上做到实时性推荐。[0066]同时为了解决前期数据集较小,推荐冷启动的问题,在步骤S1中,收集客户的个人信息,利用客户的信息进行粗粒度的推荐,比如职业稳定、收入稳定的我们可以先推荐一些中高风险的产品,等到客户产生行为后,再进行个性化推荐。[0067]尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

8

CN 111681107 A

说 明 书 附 图

1/2页

图1

9

CN 111681107 A

说 明 书 附 图

2/2页

图2

10

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- howto234.com 版权所有 湘ICP备2022005869号-3

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务