難波英嗣(広島市立大学)
竹澤寿幸(広島市立大学),奥村学(東京工業大学),倉田陽平(首都大学東京),石野亜耶(広島経済大学)
2015年7月〜2017年3月
近年,訪日外国人旅行者数が増加している一方で,必要な情報を提供するインフラの整備が十分でないという問題があった.そこで,本研究課題では,訪日外国人旅行者を対象にした情報インフラを,知能情報技術を用いて整備することで,開かれた真の国際都市の形成実現を目指す.特に,旅行ブログから,(a) 文化や習慣の違いによるトラブルを避けたり,より快適に旅行したりするためのノウハウ情報,(b) 訪れる地域に固有の魅力に関する情報を抽出し,訪日外国人旅行者に提供することを目的とする.
本研究開発では,以下のモジュール群を開発した.また,本提案書の申請者らが中心となって国際ワークショップ“Artificial Intelligence and Tourism”(PRICAI併設ワークショップ,2016年8月にタイで開催)を開催した.
以下に,各項目の開発状況について述べる.
代表的な英語旅行ブログサイトのひとつであるTravelBlog (http://traveblog.org)の全データを対象に,申請者らが開発したシステムを用いて,ノウハウ情報を含んだ75,730件の旅行ブログを自動抽出した.この中で日本に関するものは1,363件存在した.研究補助員数名で,これらのブログをすべてチェックし,ノウハウブログデータベースを構築した.各ブログには,もともとTravelBlogで分類されている地域カテゴリが付与されているが,さらに,申請者らが構築したシステムを用いてブログ著者の属性情報(性別,使用言語,旅行者の行動の種類)を付与することで,ノウハウ情報を地域カテゴリおよび著者の属性から検索できるようになった.このデータを使い,例えば,「広島を訪れたフランス語圏の男性のノウハウ情報」といった,きめ細かなノウハウ情報の検索が可能となっている.
TravelBlogの英語旅行ブログには地域カテゴリが人手で付与されているが,申請者らが過去に開発した技術を用いて自動収集した日本語旅行ブログには,こうした地域カテゴリが付与されていないため,特定の地域の旅行ブログだけを閲覧する,といったことができなかった.そこで,ブログ中で記載されている場所を正確に判定する2種類の技術の開発に取り組んだ.
第一の技術は,ブログ中で言及されている特定の場所について緯度経度を自動的に付与する,いわゆるジオコーディングと呼ばれる技術を開発した.従来のジオコーディング技術と異なる点は,従来手法では,例えば「広島に旅行した」という文において,「広島」のような広い地域を示す単語に対しても緯度経度を付与するため,位置情報の厳密さに欠けるという問題があった.この問題に対し,本研究では,例えばブログ著者が訪れたレストランやイベント会場などの場所を示す単語列を抽出することにより,より厳密なジオコーディングが可能となった.
第二の技術は,ブログ中の画像から画像認識技術を用いて場所(緯度経度)を推定し,その推定結果をブログの場所と見なす方法である.画像認識技術にはGoogle Cloud Vision APIを利用し,実験により,約90%の精度で,全体の約1割の画像の場所を推定することができることがわかった.
上記の技術を用い,地図から関連ブログを探すことができるようになった.以下,図1にシステムのスナップショットを示す.ユーザは,地図上のピンをクリックすることで,該当するブログに直接アクセスすることが可能となっている.
このシステムは,試験的に研究代表者が所属する大学のWebサーバ上で公開している (http://www.ls.info.hiroshima-cu.ac.jp/cgi-bin/travel/world/map.cgi).また,広島以外のいくつかの地域に関しては,グレック株式会社からiOSアプリおよびandroidアプリとして公開されている(http://japan-travel-guide.jp/).
TripAdvisorのクチコミ情報を対象にしたノウハウ情報の抽出および日英ノウハウ情報の比較に関する研究を実施した.TripAdvisorは,世界最大の観光ポータルサイトのひとつで,ある観光スポットを訪れた人々が様々な言語で投稿するクチコミ情報を調べることができる.この投稿のうち,日本語と英語で記述されたものからノウハウ情報を抽出するシステムを開発した.このシステムを使うことで,例えばしまなみ海道サイクリングに訪れた観光客の日本語と英語のクチコミ情報の中から,以下のようなノウハウ情報を抽出することが可能になっている.
旅行ブログには,ワイナリー見学,スキー,サイクリングなど,旅行者の体験について記述されたものがある.旅行者が何らかの体験ができる観光スポットを「体験型スポット」と呼ぶことにする.本研究では,体験型スポットについて書かれた旅行ブログを自動検出し,さらに,類似体験が可能な地域のブログを並べて表示することで,複数の類似地域が比較可能なシステムを構築した.
システムの動作例として,“learn (学ぶ)”と入力した場合の出力結果例を図2に示す.図2は書道体験と禅体験に関するブログであり,両者は「旅行者が日本文化について学ぶことができる」という点で類似している.このように,類似体験型地域を並べて表示・比較することで,ユーザは地域ごとの特色を知ることができる.
上記(a-3)で述べたブログの位置推定技術を用いて緯度経度情報が付与されたブログを対象に,ある地域に関する複数のブログを要約するシステムを開発した.図3に本研究で開発した旅行ブログエントリ閲覧システムを示す.地図上にエントリ集合を表示しており,画面下のボタンで,“見る”,“体験する”,“買う”,“食べる”,“泊まる”などの,旅行者の目的に沿ったエントリタイプを選択することができる.また,マーカーをクリックするとポップアップでエントリへのリンク付きのタイトルを表示する.ここまでの機能は,図1で示したシステムとほぼ同等である.
次に,本研究で構築した自動要約システムを中心に,既存システムからの拡張点について説明する.画面左下の緑のボタンをクリックすると,画面上に表示されているブログを自動要約し,ポップアップウィンドウ内に,その結果が表示される.図4,5は広島県の宮島付近でタイプ“見る”,“食べる”に該当するエントリ集合をそれぞれ自動要約した例である.同じ地点でも,“見る”を選択したときは「厳島神社」や「水中花火大会」,“食べる”を選択したときは「牡蠣祭り」のように,選択したタイプに沿った要約を自動生成することができる.
本研究開発の成果は,すでに広島P2ウォーカーおよびグレック株式会社が公開している以下のサービスに提供している.
本研究開発の技術を用い,中国語や韓国語で記述されたブログに対し,5種類の観光タイプ:“見る”,“体験する”,“買う”,“食べる”,“泊まる”および緯度経度情報を推定するシステムを開発中である.また,訪日外国人旅行者向けに英中韓の旅行ブログ情報を提供するサービスの2017年度内公開に向け,現在,オリックス株式会社と調整中である.