音乐推荐与分享 基于用户短长久偏好和音乐神志防备力的音乐保举模子

发布日期:2024-11-16 14:35    点击次数:56

音乐推荐与分享 基于用户短长久偏好和音乐神志防备力的音乐保举模子

频年来,跟着数字多媒体技巧的发展,音乐以愈加无邪的形势出当今东谈主们的身边,影响着东谈主们的生计。尽管东谈主们不错获取普遍的数字音乐,关联词要从完好的数据库中挑选出最可爱的音乐对用户来说是穷困和耗时的。在这种情况下,缓解这一问题的主要束缚决策是凭据用户的历史音乐行为设立用户的音乐偏好模子,为用户保举或者骄矜用户风趣的音乐。音乐保举提升了音乐做事的智能化进度,准确率高的音乐保举系统不错大大提升用户抚玩音乐的便利性。

咫尺阛阓上好多音乐平台齐有音乐保举功能,如Last. fm、虾米音乐、网易云音乐、豆瓣电台等。这些音乐保举系统率先设立我方的音乐库,然后分析歌曲的特色和用户的收听风俗,为用户作念出保举,协同过滤设施和基于内容的设施或者两者的结合是这些保举系统中常用的保举算法。举例,Last.fm凭据用户的播放行为和储藏记载,找到几许与其风趣爱好最相通的用户最可爱的音乐,保举给标的用户;网易云音乐凭据用户的歌曲播放列表、歌曲播放列表的分类和相通性来保举歌曲。但大多数现存音乐平台会忽略用户的长久偏好,或在保举时未充分探求到历史信息和刻下情境中包含的期间关联以及音乐神志属性。

用户偏好是用户在考量商品或做事时作念出的感性和有倾向性的选拔,其中,用户听歌记载在音乐保举的用户偏好建模中演出着伏击的扮装。用户将播放的下一首音乐受其最近播放过的音乐的影响,即短期偏好;长久偏好示意从用户历史记载中挖掘出的总体风趣。长久偏好深广是平定的,而短期偏好频频跟着期间的推移而频繁变化[1]。用户的音乐偏好同期受用户的总体风趣和刻下景象影响,而这期间的期间关联性及音乐神志身分进攻小觑。

为此,本文建议一种搀和音乐保举模子来束缚音乐保举中的上述问题。针对用户听歌记载,结合序列时段性对用户短长久偏好分别进行建模,同期欺诈音乐声学信号,对音乐神志因子进行分析,通过特征孝顺分析揭示序列时段、音乐神志与用户音乐偏好之间的内在关联性。在大型数据集上的普遍实验标明,本文模子显耀优于现存的音乐保举模子或设施。本文的主要孝顺如下。

(1) 欺诈多个短长久顾忌集中 (Long-Short Term Memory,LSTM) 对历史序列片断和刻下序列分别进行建模,可贵序列依赖相干;

(2) 针对历史信息和刻下信息选择不同操作,建议序列时段相通性度量历史序列与用户刻下所处期间段的筹商,收罗历史信息中最有用的信息;

(3) 基于深度学习设施从声学信号中索要音乐神志特征,并欺诈防备力机制 (Attentional Mechanism, AM) 分析音乐神志因子;

(4) 和会用户长久和短期偏好,并结合音乐神志,进行系统建模,并通过大型数据集上的普遍对比实验和消融实验考据了本文设施。

1 有关责任 1.1 基于协同过滤的音乐保举

咫尺,音乐保举的商讨主次第受协同过滤的设施,包括基于内容的设施、基于高下文的设施、基于图模子的设施等。

基于内容的音乐保举设施将与内容特征相通的音乐添加到用户的播放列表中。举例,Bogdanov等[2]从音频数据中索要声学特征,并与用户可爱的音乐进行比较,将声学特征相通的音乐作品分红一类,保举给用户;Oord等[3]使用卷积神经集中来瞻望音乐音频的潜在身分。

基于高下文的音乐保举设施[4]在传统保举设施的基础上加多有关高下文信息。举例,Cheng和Tang[5]将声学信号与用户个性相结合,Cheng等[6]试图捕捉用户特定信息对音乐偏好的影响。

基于图模子的音乐保举设施[7],将用户的历史音乐记载疗养为图模子上的边和节点,将用户对音乐的偏好行为疗养为边的权重。凭据已有信息度量用户节点与音乐节点之间的有关性,将有关性高的节点添加到用户爱好的音乐列表中。举例,Oramas等[8]建议了基于学问图谱的音乐保举设施,设立了2种显式的图形特征映射。

这些音乐保举设施的基本想想是基于用户对音乐的历史偏好行为,通过不同的相通度度量设施,径直为用户生成保举音乐列表。这些设施只可对用户的静态偏好建模,不探求用户对音乐行为的历史偏好所反应的用户风趣的波动,影响了保举音乐的准确性。

1.2 基于序列分析的音乐保举

现存的商讨主要聚首在对短期的用户偏好 (用户及时行为) 动态进行建模,这些商讨的想想是以为用户的景象在短期间内保执平定,用户可能听的下一首歌曲与用户正在听的歌曲具有相通的特征。举例,Lee等[9]将用户−物品交互和音乐音频端到端结合起来,建议深度内容−用户镶嵌模子;Sachdeva等[10]建议一种防备力神经集中,欺诈音乐序列及特征学惯用户短期偏好。

除了近期听歌行为所反应的短期偏好动态外,用户的听歌记载还发达出长久的周期性限定[11]。关联词,只消少数商讨同期探求了长久和短期偏好,其中,Wang等[12]基于音乐听歌记载和元数据,建议一种情境感知的音乐保举设施;Shen等[13]继承分层防备力集中,对用户的长久品尝和短期偏好进行建模。

上述责任固然取得了一定的进展,但频频继承兼并设施对一齐用户−音乐交互记载进行结伙建模,忽略了历史序列与刻下情境的时段有关性或长久和短期偏好对音乐保举的不同孝顺。

1.3 基于音乐神志的音乐保举

由于音乐的内容是负载神志的,神志语境也会影响音乐偏好,一些商讨在对用户偏好进行建模时也考量了音乐的神志特征。举例,Dhahri等[14]凭据隐式用户反馈构建个性化的神志感知交乐舆图;Ashu Abdul等[15]结合深度卷积神经集中设施和加权特征索要设施,从音乐数据中感知神志, 在加权特征索要设施中,通过生成隐含的用户对音乐的评分来索要用户数据与音乐神志之间的有关性;Bhaumik等[16]欺诈生成式抗争集中,从每首歌的特定对象中索要神志样本。

2 模子总体框架

本章将先容本文建议的nLSTMs+AM模子。模子分为3个模块:第1个模块为基于nLSTMs结构的用户短长久偏好建模模块,欺诈多个LSTM集中对用户听歌序列进行建模,学惯用户长久和短期偏好;第2个模块为音乐神志分析模块,继承防备力机制学习音乐神志在保举中的孝顺,即音乐神志因子;第3个模块为保举模块,欺诈全阿谀层和softmax将音乐神志因子融入用户长久偏好和短期偏好,得到最终top-N保举。

当用户u在期间戳t播放某音乐m向上1 min时,记载一条用户−音乐交互记载 $ (u,m,t) $ ,标的是鄙人一个期间戳向用户u保举最优的N首音乐。模子总体框架如图1所示。

图 1 nLSTMs+AM模子框架 Figure 1 The basic framework of the nLSTMs+AM model 2.1 用户短长久偏好建模

在实践场景中,用户对音乐的偏好很猛进度上取决于在保举时的情境,其中期间是很伏击的一个信号,举例,在上班族的日常生计中,她/他可能会在责任日的夜晚收听一些舒适减弱的音乐。关联词刻下的大部分商讨并未探求到历史序列与刻下情境的期间有关性。为束缚上述问题,本节通过分析不同期间段的音乐相通性,对历史序列进行时段性加权操作,挖掘历史信息与刻下情境的筹商,结合多个LSTM集中分别对历史记载和刻下记载进行解码,从用户长久偏好和短期偏好2个角度系统地对用户偏好进行建模,得到短长久偏好的不同示意。

图2神情了nLSTMs模块的结构,包括长久偏好建模和短期偏好建模。

图 2 用户短长久偏好建模结构 Figure 2 The structure of the user long- and short-term preference model

设 $U=\{{u}_{1},{u}_{2},\cdots,{u}_{\left|U\right|}\}$ 示意一组用户, ${M=\{{m}_{1},} {{m}_{2},\cdots,{m}_{\left|M\right|}\}}$ 示意一组音乐,每首音乐通过ID进行编码。关于用户 $ u\in U $ ,不错得到一个多段的听歌序列集 $S=\left\{{S}_{1},{S}_{2},\cdots,{S}_{n}\right\}$ ,其中 $ {S}_{n} $ 为刻下序列。序列 $ {S}_{i}\in S $ 由用户u播放的一系列音乐构成,即 ${{S}_{i}=\{{m}_{1},{m}_{2},\cdots,} {{m}_{\left|{S}_{i}\right|}\}}$ , $ m\in M $ 。

给定听歌记载S,关于标的用户 $ u\in U $ ,本节的标的是针对用户的历史序列集 $\{{S}_{1},{S}_{2},\cdots,{S}_{n-1}\}$ 和刻下序列 ${S}_{n}=\{{m}_{1},{m}_{2},\cdots,{m}_{t-1}\}$ ,对用户进行长久和短期偏好建模,其中 $ {m}_{t-1} $ 是u最近一次播放过的音乐。

2.1.1 基于时段性的历史序列示意

当对长久偏好建模时,一个直不雅的意见是凭据刻下情况从历史中有选拔地收罗最有用的信息。因此,想象了一个基于序列时段性的期间加权操作来学习标的用户历史序列的示意。

(1) nLSTMs集中:领先,给定用户u,欺诈n个可贵序列依赖相干的LSTM集中对每个序列 ${S}_{h}\in \{{S}_{1},{S}_{2},\cdots,{S}_{n}\}$ 中的悉数音乐 $\left\{{m}_{1},{m}_{2},\cdots,{m}_{\left|{S}_{h}\right|}\right\}$ 进行编码。

$ {{{{\boldsymbol{h}}}}_t} = {\rm{LSTM}}\left( {{m_t},{{\boldsymbol{h}}_{t - 1}}} \right) $ (1)

式中: ${{{\boldsymbol{h}}}}_{t}$ 为LSTM的荫藏景象。这么, $ {S}_{h} $ 中的音乐 $\left\{{m}_{1}, {m}_{2},\cdots, {m}_{\left|{S}_{h}\right|}\right\}$ 被编码为 $\left\{{\boldsymbol{h}}_{1},{\boldsymbol{h}}_{2},\cdots,{\boldsymbol{h}}_{\left|{S}_{h}\right|}\right\}$ 。

(2) 序列时段性加权操作:在实践场景中,音乐的流行进度跟着期间的推移而变化。举例,东谈主们可能在午夜变得伤感,播放的音乐也可能疗养为抒怀的。因此,每个序列 $ {S}_{h} $ 的总体示意 ${\boldsymbol{s}}_{h}$ 应该包含这些信息,以拿获期间明锐性。为好意思满这少量,关于长久偏好建模,建议了时段相通性加权操作。具体来说,将1天分袂为4个期间段,那么1周可分袂为28个期间段。关于每个期间段i,构造一个音乐集 ${H}_{i}=\{{m}_{1},{m}_{2},\cdots,{m}_{\left|{H}_{i}\right|}\}$ ,其中 $ m\in M $ 是在期间段i内至少一个用户播放的音乐。然后,计较第i和第j个期间段的期间相通度 $ {\tau }_{i,j} $ 。

$ {\tau }_{i,j}=\frac{\left|{H}_{i}\cap {H}_{j}\right|}{\left|{H}_{i}\cup {H}_{j}\right|} $ (2)

从直不雅上看,2个期间段的音乐类似越多,它们的相通度就越高。关于某个历史序列 $ {S}_{h} $ ,凭据每首音乐的播放期间,不错推导出 $ \left|{S}_{h}\right| $ 首音乐的播放期间段序列,用 $\{{p}_{1},{p}_{2},\cdots,{p}_{\left|{S}_{h}\right|}\}$ 示意,其中 $p\in \{1,2,\cdots,28\}$ 。

凭据标的用户确刻下期间段c,某个历史序列 $ {S}_{h} $ 的总体示意 ${\boldsymbol{s}}_{h}$ 为

$ {\boldsymbol{s}}_{h}={\sum }_{t=1}^{\left|{S}_{h}\right|}{w}_{t}{\boldsymbol{h}}_{t},{w}_{t}=\frac{\mathrm{exp}({\tau }_{c,{p}_{t}}) }{{\displaystyle\sum }_{j=1}^{\left|{S}_{h}\right|}\mathrm{exp}({\tau }_{c,{p}_{j}}) } $ (3)

式中: $ {\tau }_{c,{p}_{j}} $ 为 $ {S}_{h} $ 中刻下期间段c与第j次播放的音乐的期间段之间的期间相通性。

通过上述加权操作,某段历史序列示意 ${\boldsymbol{s}}_{h}$ 与用户刻下期间段及最近听歌序列设立筹商。到咫尺放浪,不错用 $\left\{{\boldsymbol{s}}_{1},{\boldsymbol{s}}_{2},\cdots ,{\boldsymbol{s}}_{n-1}\right\}$ 来示意n−1段历史序列。

2.1.2 短长久偏好建模

关于刻下轨迹 $ {S}_{n} $ ,欺诈一个单独的LSTM来对最近播放的音乐进行显式建模,则刻下轨迹的最终荫藏景象 ${\boldsymbol{h}}_{t-1}$ 可示意为用户短期偏好。此外,关于 $ {S}_{n} $ ,序列时段性加权操作被平均池代替。

$ {\boldsymbol{s}}_{n}=\frac{1}{\left|{S}_{n}\right|}{\sum }_{t=1}^{\left|{S}_{n}\right|}{\boldsymbol{h}}_{t} $ (4)

其基情愿趣是,在轨迹 $ {S}_{n} $ 中新播放的音乐更能代表用户最近的偏好,而平均池保存了 $ {S}_{n} $ 中悉数音乐的信息,这对长久和短期偏好建模齐有平正。

在学习了悉数轨迹 $S=\left\{{S}_{1},{S}_{2},\cdots,{S}_{n}\right\}$ 的示意 $\left\{{\boldsymbol{s}}_{1},{\boldsymbol{s}}_{2},\cdots,{\boldsymbol{s}}_{n}\right\}$ 之后,通过加权均值化操作来计较用户长久偏好 ${\boldsymbol{s}}_{l}$ 。

$ {\boldsymbol{s}}_{l}=\frac{1}{\left|{S}_{n}\right|}{\sum }_{i=1}^{\left|{S}_{n}\right|}{\boldsymbol{W}}_{l}{\mathit{s}}_{i} $ (5)

式中: ${\boldsymbol{W}}_{l}$ 为可测验的权重矩阵。

2.2 音乐神志防备力建模

音乐是一种抒发神志的艺术形势,其神志抒发当作音乐的高阶属性,是用户偏好的伏击影响身分。本节欺诈深度学习设施对音频信号中索要的声学特征进行建模,得到音乐神志特征,并通过防备力机制分析音乐神志在保举中的权重,以获取更准确的用户音乐偏好。

2.2.1 音乐特征索要

音乐的声学测量已被平常商讨,在这项责任中,领先使用开源多媒体特征索要器openSMILE来索要988维的声学特搜集,包括初级别神情符(如强度、响度、曲调等),以及这些神情符的δ悉数和一些函数值(如限制、平均值、偏度、峰度) 。

接着,继承一个深度神经集中 (Deep Neural Network,DNN) 对声学特征进行测验,以隐式和非线性的形式对音乐的神志建模 (振奋、可爱、惊诧、盛怒、悲悼、怯生生、愤激等) ,生成7维音乐神志向量。DNN的输入是悉数声学特征向量的拼接,DNN的历程形势上不错抒发为

$ {\boldsymbol{z}}_{h+1}=\sigma ({\boldsymbol{W}}_{{h}}{\boldsymbol{z}}_{h}+{\boldsymbol{b}}_{{h}}) $ (6)

式中: ${\boldsymbol{W}}_{{h}}$ 、 ${\boldsymbol{b}}_{{h}}$ 为参数, ${\boldsymbol{z}}_{h}$ 为第h层的荫藏层景象。

2.2.2 神志潜在因子建模

领先将悉数特征向量 (音乐神志特征、用户ID、音乐ID、期间特征) 疗养为d维镶嵌向量 ${{\boldsymbol{x}}_{i}}{\text{′}}$ ,其中期间特征凭据1天 (早上、下昼、晚上和午夜) 和1周 (责任日和周末) 的期间对每个用户−音乐交互的期间戳进行分类。

$ {{\boldsymbol{x}}_{i}}{\text{′}}={\boldsymbol{W}}_{{{\boldsymbol{x}}}_{i}}{\boldsymbol{x}}_{i}+{\boldsymbol{b}}_{{{\boldsymbol{x}}}_{i}} $ (7)

式中: ${\boldsymbol{W}}_{{{\boldsymbol{x}}}_{i}}$ 、 ${\boldsymbol{b}}_{{{\boldsymbol{x}}}_{i}}$ 为镶嵌参数 (关于独热疏淡向量, $\boldsymbol{b}=0$ ) , ${\boldsymbol{x}}_{i}$ 为各特征向量。

防备力机制在将不同部分压缩成单一示意时区分它们的伏击性[17]。领先对特征进行加权乞降:

$ {\boldsymbol{e}}_{\mathrm{a}\mathrm{t}\mathrm{t}}={\sum }_{i=1}^{n}{\alpha }_{i}{\boldsymbol{x}}_{i}{\text{′}} $ (8)

式中: $ {\alpha }_{i} $ 为镶嵌特征 ${\boldsymbol{x}}_{i}{\text{′}}$ 的防备力分数。在这里,防备力分数通过一个2层防备力集中进行计较。

$ {{\alpha }_{i}}{\text{′}}={\boldsymbol{w}}^{\mathrm{T}}\sigma (\boldsymbol{W}{{\boldsymbol{x}}_{i}}{\text{′}}+\boldsymbol{B}) +{\boldsymbol{b}} $ (9)

式中:W、B是第1层参数,w、b是第2层参数。式 (4) 的防备力分数进一步继承softmax归一化处理。

$ {\alpha }_{i}=\frac{\mathrm{exp}({{\alpha }_{i}}{\text{′}}) }{{\displaystyle\sum }_{i=1}^{n}\mathrm{exp}({{\alpha }_{i}}{\text{′}}) } $ (10)

这么,最终得到了音乐的神志潜在因子,即 ${\boldsymbol{e}}_{\mathrm{a}\mathrm{t}\mathrm{t}}$ ,如图3所示。

图 3 音乐神志建模结构 Figure 3 The structure of the music emotion model 2.3 和会保举

在得到音乐神志因子及用户长久、短期偏好的示意之后,计较 $ \left|M\right| $ 首音乐上的概率散播 $\boldsymbol{p}$ :

$ \boldsymbol{p}=\mathrm{s}\mathrm{o}\mathrm{f}\mathrm{t}\mathrm{m}\mathrm{a}\mathrm{x}({\boldsymbol{W}}_{{\boldsymbol{p}}}({\boldsymbol{e}}_{\mathrm{a}\mathrm{t}\mathrm{t}} \oplus {\boldsymbol{s}}_{l}\oplus{\boldsymbol{h}}_{t-1}) ) $ (11)

式中: $\oplus$ 为全阿谀层, ${\boldsymbol{W}}_{{\boldsymbol{p}}}$ 为悉数音乐的可测验投影矩阵, ${\boldsymbol{e}}_{\mathrm{a}\mathrm{t}\mathrm{t}}$ 为音乐神志因子, ${\boldsymbol{s}}_{l}$ 、 ${\boldsymbol{h}}_{t-1}$ 分别为用户的长久和短期偏好。

因此,标的用户鄙人一个期间戳t最有可能播放的音乐便是概率最大的阿谁,则标的函数不错示意为对数似然:

$ L=-{\sum }_{k=1}^{N}\mathrm{ln}({p}_{k}) $ (12)

式中:N为测验样本总和, $ {p}_{k} $ 为模子对第k个测验样本生成音乐的概率。探求到音乐保举中负反馈的当然穷乏,关于每个正样本 $ (u,{m}^{+},t) $ ,当场选拔u从未交互的音乐 $ {m}^{-} $ ,酿成负样本 $ (u,{m}^{-},t) $ 。负样本在每次测验遍历中中式,在不同遍历中可能有所不同。

3 实验及分析

本节通过在实在数据集上普遍的对比实验和消融实验来评估nLSTMs+AM模子。

3.1 实验建树 3.1.1 数据集

本文实验数据来源于Last.fm ( http://www.last.fm) 的1K users数据集,Last.fm是一家英国的集中电台和音乐社区,其向开荒者提供了丰富的API,其中包括1K users。该数据集当作有高下文信息的隐性反馈数据集的代表,包含了近1000位用户的悉数音乐播放记载与播放期间,以及用户和音乐的有关信息。

关于该数据集,过滤播放用户少于10个的不受迎接的音乐;将用户1 d内的悉数播放记载视为一个单一的轨迹,并删除少于3个播放记载的轨迹;轨迹少于5条的非活跃用户也会被过滤掉。经过预处理后,数据包含301080条用户−音乐交互记载,包含934个用户和40868首音乐。

将每个用户的前80%的轨迹用于测验,其余用于测试。固然某个用户音乐记载可能触及几个交互记载,但保证它们齐属于测验集或测试集。

探求到期间戳,每个测试用例只消一个正样本,每个正测试样本与99个当场抽样的负样本配对,每种设施瞻望100个样本的偏好得分。

3.1.2 对比模子

本文将建议的nLSTMs+AM与以下通用的基于深度学习的保举设施进行比较:

LSTM:这是RNN模子的一种变体,在处理序列数据方面发达精采。

DeepFM[18]:它结合了因式理会机和神经集中。

AFM[19]:它通过一个神经防备力集中来鉴识不同特征交互的伏击性。

此外,还探求了以底下向音乐的保举设施:

c-IFRM[20]:一种针对用户音乐播放记载,结合聚类和潜在因子模子的搀和音乐保举设施。

DCUE[9]:深度内容−用户镶嵌模子的简称,一种欺诈用户−物品交互和音乐音频内容的搀和设施。

STABR[10]:一种欺诈防备力神经集中从音乐序列及特征中学惯用户短期偏好的设施。

MEM[12]:凭据用户的收听记载,通过音乐镶嵌来对用户的全局和高下文音乐偏好进行建模。

PEIA[13]:一种对用户的长久品尝和短期偏好进行建模的防备力模子。

3.1.3 评价主义

为了评估每个设施的性能,继承以下3个在音乐保举设施中常用的评价主义:

Recall@K。调回率,示意正确瞻望出正样本占实质正样本的概率。

HR@K。掷中率,在Top-N保举中,是一种常用的讨论调回率的主义,计较公式为

$ \mathrm{H}\mathrm{R}@{K}=\frac{\mathrm{N}\mathrm{u}\mathrm{m}\mathrm{b}\mathrm{e}\mathrm{r}\mathrm{o}\mathrm{f}\mathrm{H}\mathrm{i}\mathrm{t}\mathrm{s}@{K}}{\mathrm{G}\mathrm{T}} $ (13)

式中:GT为悉数的测试汇注,NumberofHits@K为每个用户Top-K列表中属于测试汇注的个数的总和。

NDCG@K。归一化折损累计增益,用来评价Top-K列表与用户实在交互列表的差距。高关联度的效果比一般关联度的效果更影响最终的主义得分;有高关联度的效果出当今更靠前的位置的时候,主义得分会越高。

在本文中,选拔K=10进行评估。

3.1.4 参数建树

将悉数基于深度学习设施的镶嵌维度和荫藏景象建树为500。模子中悉数的参数继承高斯散播当场运行化,并欺诈梯度下跌优化算法Adam进行优化,批量大小为256,学习率为0.01。

3.2 实验效果 3.2.1 保举性能评估

不同的保举设施的效果如表1所示。在每一列中,最佳的效果用黑体越过袒露。

表 1 不同设施的保举性能 Table 1 Experimental results obtained by different methods on the Last.fm dataset

从统计数据中得出以下不雅察效果:

(1) 在实验数据集上,本文建议的nLSTMs+AM在每个主义上齐执续显耀地优于悉数对比模子, nLSTMs+AM的Recall@10、HR@10和NDCG@10分别达到0.7048,0.8117,0.5435。定量评价效果澄澈地讲授了该设施的优厚性。

(2) 基于序列分析的设施 (STABR、MEM、PEIA) 固然细节结构不同,但总体上优于基于相通性度量的设施(DeepFM、AFM、c-IFRM) ,这讲明欺诈听歌记载对用户偏好进行为态建模不错提升保举性能。

(3) 在对比模子设施中,MEM和PEIA发达最佳。由于这两种设施齐探求了长久和短期偏好,它讲明了在短期偏好建模以外,从历史信息建模长久偏好的伏击性。关联词,在莫得区别探求历史和刻下序列并挖掘两者有关性的情况下,MEM和PEIA很难使保举精度最大化,这是nLSTMs+AM优于这两种设施的要津身分。

(4) 与其他模子比拟,基于防备力机制的设施 (AFM和PEIA) 发达较优,体现了以不同的权重区分特征的伏击性。

(5) DeepFM、AFM均优于LSTM。这袒露了建模不同音乐之间的相干的上风。此外,c-IFRM仅以高下文信息当作输入,其性能不如DCUE、STABR、MEM。比拟之下,其他的设施将音乐特征或音乐神志和会到序列建模中,纠正了性能。

3.2.2 用户短长久偏好模块评估

为了考据nLSTMs+AM中长久、短期偏好建模和序列时段性加权操作对性能增益的孝顺,本部分进一步对模子的简化版块进行消融测试。

S_Model:这个版块删除了本文模子的长久模块,仅欺诈单个LSTM集中对用户听歌记载进行建模得到用户短期偏好。

L_Model:这个版块删除了本文模子的短期模块,只启用了长久模块。

L_Model' :这个版块删除了本文模子的短期模块,且历史序列片断的时段性加权操作以平均池化操作代替。

Model' :这个版块继承平均池化操作代替本文模子中的序列时段性加权操作。

nLSTMs+AM左迁版块的效果如表2所示。

表 2 不同nLSTMs+AM变体的性能 Table 2 Performance of different nLSTMs+AM variants

通过消融实验,不错不雅察到:

(1) L_Model' 老是比S_Model发达得更好,原因可能是L_Model' 不错更好地捕捉用户的长久周期性,这澄澈地展示了建模用户长久偏好的平正。

(2) L_Model相干于L_Model' 、Model' 均进一步提升了保举性能,原因是L_Model不错凭据用户确刻下景象更好地捕捉用户历史信息中有关性较大的部分,这考据了序列时段性分析的有用性。

(3) 固然S_Model的竞争力不如其他变体模子,但它仍然不错获取比表1中的LSTM和c-IFRM等对比模子更好的瞻望性能,这是由于S_Model的有用性来自于防备力模子,它捕捉了音乐与短期偏好之间的神志相干。

(4) 完好的模子nLSTMs+AM是上述变体模子的组合,在数据集上的性能是最佳的,标明长久、短期偏好和序列时段性分析齐对用户下一首音乐的选拔有积极的影响。

3.2.3 音乐时段与神志孝顺分析

在本末节中,通过用户偏好分析评估期间段特征和防备力机制中音乐神志特征的有用性。

针对音乐神志特征和期间特征,分析1 d中音乐偏好的期间变化。具体来说,温存用户播放音乐的神志向量,计较4个期间段中7维神志的平均值。如图4所示,东谈主们在白日更倾向于选拔更多抒发“可爱”和“盛怒”的立志东谈主心的音乐,而在夜晚更倾向于选拔抒发“怯生生”和“悲悼”的压抑的音乐,这与东谈主们的日常神志变化情况一致。

图 4 音乐神志特征分析 Figure 4 Analysis of the emotional characteristics of music

结合表3中特定用户的音乐行为示例,不错彰着看出nLSTMs+AM模子或者较准确地动态揣度出不同特征的伏击性 ( $ {\alpha }_{\rm{e}} $ 、 $ {\alpha }_{\rm{t}} $ 分别为神志特征和期间特征的防备力分数) 。从第1条和第2笔记载中不错看出,Maroon 5雀跃的音乐时常为用户所爱好。关联词,在第3笔记载中,跟着用户在午夜变得伤感,播放的音乐疗养为抒怀的音乐。在这种情况下,用户对音乐的选拔同期受到神志和期间的影响,而防备力模子不错以不同的防备力分数 $ {\alpha }_{\rm{e}} $ 、 $ {\alpha }_{\rm{t}} $ 自符合地瞻望情况。

表 3 用户音乐行为示例 Table 3 Examples of the user music behaviors 3.2.4 历史序列长度的影响分析

nLSTMs+AM模子的一个要津孝顺是探求了历史信息对用户长久偏好进行建模。该部分实验凭据用户历史轨迹的数目将他们的轨迹分红7组,第1组用户领有4条或更少的历史轨迹,而领有10条或更多历史轨迹的用户属于终末一组,然后将每一组当作模子输入分别评估性能,效果如图5所示。

图 5 历史序列长度影响 Figure 5 Influence of the historical sequence length

图5袒露了跟着历史序列长度的增长,模子性能的合座高潮趋势。因为揭示东谈主的周期性限定需要期间,历史序列长度越长,本文的长久偏好建模模块不错索要的信息就越多。

4 归来

本文建议了一个新的音乐保举模子,即nLSTMs+AM。应用多LSTM集中对用户短长久偏好进行建模,应用防备力机制对音乐神志因子进行分析。从实验效果不错看出,通过深度学习框架进行特征索要和基于历史信息与刻下情境有关性的短长久偏勤学习,不错构建具有精采性能的音乐保举系统。经实验考据本文建议的音乐保举模子有用可行。值得防备的是,在音乐保举中,音乐神志不仅能通过声学信号发达出来,还不错通过音乐挑剔等信息体现出来,同期,用户神志也在短期内影响用户音乐偏好。在往常的商讨中,缱绻通过引入音乐挑剔及用户及时辰享 (如音乐软件酬酢动态共享) 等文本信息来束缚这些问题。



上一篇:明星新闻与动态速递 栽培先导:推开交响乐之门——交响乐赏析提高讲座
下一篇:明星新闻与动态速递 保举一些相宜爵士舞的舞曲

Powered by 娱乐新知网 @2013-2022 RSS地图 HTML地图