【卒研紹介】学会発表報告: ウェブ視聴履歴に基づくウェブサイトの類似性

<松田ゼミ-3 前へ>

報告者: 青木友花(情報デザイン専攻/松田ゼミ)

松田ゼミに所属するゼミ生(青木)は、卒業研究として「ウェブ視聴履歴に基づくウェブサイトの類似性に関する研究」を行い、卒業論文として提出ました。今回はその締めくくりとして、2月27日、東京タワーの麓の機械振興会館で開催された電子情報通信学会の情報・システムソサエティが主催するソフトウェアインタプライズモデリング研究会で発表してきましたので報告します。発表資料は、ここを参照ください。

研究会に関して

ソフトウェアインタプライズ研究会は、インターネットとエンタープライズを足し合わせた造語で、インターネット上でのエンタープライズ型のWebベースアプリケーションやソフトウェア、そのビジネスモデルに関する研究を行っている企業や大学の研究者が集まり、発表、議論を行う研究会です。

presentation

発表内容

本研究はソネット株式会社の竹内彰一シニアリサーチフェローのご協力のもと、ソネットメディアワークス社が保有する「ユーザがどのウェブサイトを何回見たか(ウェブ視聴履歴と呼びます)」というデータを用い、そこから全体のユーザを代表するユーザを約2万人選び出し、それぞれのユーザが2084個のサイトに対して1ヶ月間に何回アクセスしたかという情報、すなわち「ユーザのアクセス行動」から見たサイト間の類似性を2種類の統計手法で評価したものです。ここで用いたあるユーザのアクセス行動とは、例えば、あるユーザがその1ヶ月の間にサイトAを830回、サイトBに2015回、サイトCを326回見た場合には、そのユーザのIDと830、2015、326という回数だけを扱うもので、サイトA、B、Cが具体的にどのような内容のサイトであるかという情報は含まれません。

研究の結果、あるサイトにアクセスしたユーザが次にどのようなサイトをアクセスするかを予測できる可能性があることを確認でき、また、今回用いたアクセス行動履歴のデータにはサイトの内容に関する情報を含んでいないにも関わらず、それを用いて計算した結果得られた類似サイトの内容を実際に調べてみると、以下の図に示すような「内容の類似性」があることが分かり、行動との関係性を見出すことができました。

visualization

発表に関して

研究会当日は、日本IBMの方の特別講演で始まり、口頭発表が全部で7件ありました。参加者は30名弱で、ほとんどが企業の方でした。発表時間は20 分、質問時間が5分でした。初めての学会発表であり、また、20分もの発表をしたことがなかったので、うまく話せるか不安でしたが、発表前に竹内さん、松田先生に何回も練習しいただけたので落ち着いて話すことができました。発表後、3人の企業の方から質問をいただいたのですが、うまく答えることができず(松田先生に助けていただきました)質問という場の重要性をあらためて感じました。

coauthor

終わりに

3年生の後半から本研究を始め、就活などで一時期大変な時期もありましたが、なんとか学会発表までこぎつけました。終わってみると一般企業の研究者の前で発表するという大変よい経験ができたと思いました。今回の卒業研究は、ソネット株式会社の竹内シニアリサーチフェローのご厚意とご協力で実現しました。このような場を持たせていただけたことに大変感謝し、ここに厚く御礼申し上げます。今後は、この経験を社会で活かして頑張っていきたいと思います。