A Study on Customer Purchase Behavior Analysis Based on Hidden Topic Markov Models

IF 0.6 Q4 ENGINEERING, INDUSTRIAL
M. Hotoda, G. Kumoi, M. Goto
{"title":"A Study on Customer Purchase Behavior Analysis Based on Hidden Topic Markov Models","authors":"M. Hotoda, G. Kumoi, M. Goto","doi":"10.7232/IEMS.2021.20.1.48","DOIUrl":null,"url":null,"abstract":"1. はじめに 近年,ECサイトを通じたオンラインでの商品購買は広く 一般消費者に受け入れられるようになり,市場規模が拡大し ている [1].ECサイト上では,ユーザの各ページの閲覧行動 の詳細なログが取得可能であるため,これらのデータを活用 したWebマーケティング技術の重要性が高まっている.一 方,ECサイトにおける購買に至る割合(Conversion Rate ; CVR)は通常,高々数%であることが知られている [2]. そのため,多くの ECサイトで CVRを改善するための施 策が必要とされている.例えば,ユーザの購買意欲を把握す ることで効果的なタイミングで施策を打ったり,購買につな がりやすいページを把握することでそのページにユーザを誘 導したりすることにより,CVRの向上が見込める. 一般に,ユーザは商品を購入する前に ECサイト上の様々 なページを閲覧することが多い.したがって,ユーザの思考 状態(購買意欲の有無や嗜好,ニーズ等)の変化は ECサ イトのページ遷移傾向に反映されていると考えられる.その ため,閲覧履歴データを分析することで,ユーザの購買意欲 を抽出できれば,適切な施策の一助になると考えられる.こ の様な分析においては,ユーザの思考状態に依存して各閲覧 ページが生成されたと仮定することは極めて自然であり,観 測不可能な思考状態を観測可能な閲覧ページから推測できる と考えられる.そこで本研究では,ユーザのページ遷移の背 後に潜在トピック(潜在クラス)を仮定するモデルを提案 する. 従来の潜在クラスモデルをページ遷移データに適用すると, 連続的に閲覧した一連のページ全体に同じ潜在トピックを仮 定するか,または各ページに対し毎回異なる潜在トピック を仮定するかのどちらかである.しかし,閲覧中にユーザの 思考状態が変化する可能性は十分に考えられるため,連続的 に閲覧した一連のページ全体に同じ潜在トピックを仮定する ことは好ましくない.一方で,ページごとにユーザの思考状 態が頻繁に変わることもほとんどないと考えられるため,毎 ページ異なる潜在トピックを仮定したトピックモデルの適用 も好ましくない. そこで本研究では, Hidden Topic Markov Models (HTMM)[3]をベースとし,リアルタイムに閲覧履歴データ の分析を可能にした購買行動分析モデルを提案する.HTMM は,前後関係を考慮しない Latent Dirichlet Allocation (LDA)[4]に隠れマルコフモデル(Hidden Markov Chain model ; HMM)の考え方を援用したモデルである.HTMM は文書に対して複数の潜在トピックを想定するが,LDAと は異なり,文書中の文単位での潜在トピックを考える.す なわち,各文中の単語は同じ潜在トピックに存し,かつ連続 する文は同じ潜在トピックを持つ可能性が高いことを仮定す る.このため,文書を同じ統計的特徴を持つ複数の文群に分 割することができる.したがって HTMMを閲覧履歴デー タに援用し,ページ単位での潜在トピックの推定を行うこと で,閲覧履歴を同じ特徴を持つ複数の群に分割することがで きる.そのうえで実際の閲覧履歴データから得られる購買実 績を併用することで,各潜在トピックの購買確率を求めるこ とができる.提案モデルにより,ユーザの購買意思をリアル タイムで予測することが可能になると考えられる.加えて, 各ユーザの潜在トピックの変化点を検出することが可能にな り,ユーザの思考が変化する際にどのようなページ遷移が起 こっているかを理解することができる.本研究では,実閲覧 履歴データを用いて分析し,提案手法の有効性を検証する. 2. 関連研究 2.1. 隠れマルコフモデル Hidden Markov Model(HMM)は,観測不可能なマ ルコフ過程とその各状態に依存して生成されるシンボルの組 み合わせによって,シンボルの系列を表現するモデルである. HMMの対象となる系列データは,複数の状態を持ち,それ らの状態がある遷移確率により遷移するマルコフモデルと仮 定される.これを一次マルコフ性という. 2.2. Hidden Topic Markov Model Hidden Topic Markov Model(HTMM)は,LDAに HMMの考え方を援用した,文書生成モデルである.図 1に HTMMのグラフィカルモデルを示す.","PeriodicalId":45245,"journal":{"name":"Industrial Engineering and Management Systems","volume":"301 1","pages":"48-60"},"PeriodicalIF":0.6000,"publicationDate":"2021-03-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Industrial Engineering and Management Systems","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.7232/IEMS.2021.20.1.48","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"ENGINEERING, INDUSTRIAL","Score":null,"Total":0}
引用次数: 2

Abstract

1. はじめに 近年,ECサイトを通じたオンラインでの商品購買は広く 一般消費者に受け入れられるようになり,市場規模が拡大し ている [1].ECサイト上では,ユーザの各ページの閲覧行動 の詳細なログが取得可能であるため,これらのデータを活用 したWebマーケティング技術の重要性が高まっている.一 方,ECサイトにおける購買に至る割合(Conversion Rate ; CVR)は通常,高々数%であることが知られている [2]. そのため,多くの ECサイトで CVRを改善するための施 策が必要とされている.例えば,ユーザの購買意欲を把握す ることで効果的なタイミングで施策を打ったり,購買につな がりやすいページを把握することでそのページにユーザを誘 導したりすることにより,CVRの向上が見込める. 一般に,ユーザは商品を購入する前に ECサイト上の様々 なページを閲覧することが多い.したがって,ユーザの思考 状態(購買意欲の有無や嗜好,ニーズ等)の変化は ECサ イトのページ遷移傾向に反映されていると考えられる.その ため,閲覧履歴データを分析することで,ユーザの購買意欲 を抽出できれば,適切な施策の一助になると考えられる.こ の様な分析においては,ユーザの思考状態に依存して各閲覧 ページが生成されたと仮定することは極めて自然であり,観 測不可能な思考状態を観測可能な閲覧ページから推測できる と考えられる.そこで本研究では,ユーザのページ遷移の背 後に潜在トピック(潜在クラス)を仮定するモデルを提案 する. 従来の潜在クラスモデルをページ遷移データに適用すると, 連続的に閲覧した一連のページ全体に同じ潜在トピックを仮 定するか,または各ページに対し毎回異なる潜在トピック を仮定するかのどちらかである.しかし,閲覧中にユーザの 思考状態が変化する可能性は十分に考えられるため,連続的 に閲覧した一連のページ全体に同じ潜在トピックを仮定する ことは好ましくない.一方で,ページごとにユーザの思考状 態が頻繁に変わることもほとんどないと考えられるため,毎 ページ異なる潜在トピックを仮定したトピックモデルの適用 も好ましくない. そこで本研究では, Hidden Topic Markov Models (HTMM)[3]をベースとし,リアルタイムに閲覧履歴データ の分析を可能にした購買行動分析モデルを提案する.HTMM は,前後関係を考慮しない Latent Dirichlet Allocation (LDA)[4]に隠れマルコフモデル(Hidden Markov Chain model ; HMM)の考え方を援用したモデルである.HTMM は文書に対して複数の潜在トピックを想定するが,LDAと は異なり,文書中の文単位での潜在トピックを考える.す なわち,各文中の単語は同じ潜在トピックに存し,かつ連続 する文は同じ潜在トピックを持つ可能性が高いことを仮定す る.このため,文書を同じ統計的特徴を持つ複数の文群に分 割することができる.したがって HTMMを閲覧履歴デー タに援用し,ページ単位での潜在トピックの推定を行うこと で,閲覧履歴を同じ特徴を持つ複数の群に分割することがで きる.そのうえで実際の閲覧履歴データから得られる購買実 績を併用することで,各潜在トピックの購買確率を求めるこ とができる.提案モデルにより,ユーザの購買意思をリアル タイムで予測することが可能になると考えられる.加えて, 各ユーザの潜在トピックの変化点を検出することが可能にな り,ユーザの思考が変化する際にどのようなページ遷移が起 こっているかを理解することができる.本研究では,実閲覧 履歴データを用いて分析し,提案手法の有効性を検証する. 2. 関連研究 2.1. 隠れマルコフモデル Hidden Markov Model(HMM)は,観測不可能なマ ルコフ過程とその各状態に依存して生成されるシンボルの組 み合わせによって,シンボルの系列を表現するモデルである. HMMの対象となる系列データは,複数の状態を持ち,それ らの状態がある遷移確率により遷移するマルコフモデルと仮 定される.これを一次マルコフ性という. 2.2. Hidden Topic Markov Model Hidden Topic Markov Model(HTMM)は,LDAに HMMの考え方を援用した,文書生成モデルである.図 1に HTMMのグラフィカルモデルを示す.
基于隐主题马尔可夫模型的顾客购买行为分析研究
1.前言近年来,通过电子商务网站进行在线购买商品逐渐被普通消费者所接受,市场规模不断扩大。[1].电子商务网站上用户浏览各页面的行为。的详细记录,因此利用这些数据的Web营销技术变得越来越重要。另一方面,电商网站的购买比例(Conversion Rate;CVR)通常为百分之几[2].因此,很多电商网站都需要采取改善CVR的措施。例如,通过掌握用户的购买欲望,在有效的时机采取措施,通过掌握容易购买的页面,将用户引导到该页面,CVR将得到提高。一般来说,用户在购买商品之前通常会浏览电子商务网站上的各种网页,因此,用户的思考状态(有无购买欲望、嗜好、需求等)的变化是电子商务网站上的差异。因此,如果通过分析浏览历史数据,找出用户的购买欲望,将有助于采取适当的措施。在这样的分析中,很自然地假设根据用户的思考状态生成各浏览页面,通过可观测的浏览页面就能推测出无法观察到的思考状态。因此,本研究提出了一种模型,在用户的页面转换背后假设潜在主题(潜在类别)。如果将传统的潜在类模型应用于页面迁移数据,在连续浏览的一系列页面中都假设相同的潜在主题,或者每次都对每个页面假设不同的潜在主题。由于充分考虑到思考状态变化的可能性,所以在连续浏览的一系列页面中全部假定相同的潜在主题是不可取的。另一方面,由于用户的思考状态几乎不会在每页频繁变化,因此,假设每页不同的潜在主题的主题模型的应用也不可取。以Hidden Topic Markov Models (HTMM)[3]为基础,提出了能够实时分析浏览历史数据的购买行为分析模型。HTMM不考虑前后关系隐藏在Latent Dirichlet Allocation (LDA)[4]中的马尔可夫模型(Hidden Markov Chain model;HMM)的思考模式。HTMM针对文档设想多个潜在主题,但与LDA不同的是,HTMM考虑的是以文档中的句子为单位的潜在主题。假设每个句子中的单词存在相同的潜在主题,并且连续的句子很有可能具有相同的潜在主题,因此可以将文档分成具有相同统计特征的多个句子群。将HTMM用作浏览历史数据,以页面为单位推测潜在主题,就可以将浏览历史分割成具有相同特征的多个组,然后根据实际的浏览历史数据获得购买实物。通过同时使用绩,可以求出各潜在主题的购买概率。通过方案模型,有望实时预测用户的购买意向。另外,还可以检测出每个用户的潜在主题的变化点,从而了解当用户的思维发生变化时,页面发生了怎样的转变。本研究利用真实浏览历史数据进行分析,验证了提案方法的有效性。相关研究2.1.隐马尔可夫模型Hidden Markov Model(HMM)是依赖于不可观测的马尔可夫过程及其各个状态而产生的一组符号通过组合来表现符号系列的模型。HMM的对象系列数据具有多个状态,这些状态根据某一迁移概率而迁移的马尔可夫模型和虚拟被确定。这被称为一次马尔可夫性。2.2. Hidden Topic Markov Model Hidden Topic Markov Model(HTMM)在LDA中这是一种援引了HMM思想的文档生成模型。图1示出HTMM的图形模型。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
CiteScore
2.20
自引率
28.60%
发文量
45
期刊介绍: Industrial Engineering and Management Systems (IEMS) covers all areas of industrial engineering and management sciences including but not limited to, applied statistics & data mining, business & information systems, computational intelligence & optimization, environment & energy, ergonomics & human factors, logistics & transportation, manufacturing systems, planning & scheduling, quality & reliability, supply chain management & inventory systems.
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信