日本データベース学会

dbjapanメーリングリストアーカイブ(2021年)

[dbjapan] DBSJ Newsletter Vol. 13, No. 7: ICDM 2020, BigData 2020, WI 2020

  • To: dbjapan [at] dbsj.org
  • Subject: [dbjapan] DBSJ Newsletter Vol. 13, No. 7: ICDM 2020, BigData 2020, WI 2020
  • From: Kosetsu Tsukuda <k.tsukuda [at] aist.go.jp>
  • Date: Mon, 15 Feb 2021 13:23:12 +0900
  • Arc-authentication-results: i=1; mx.microsoft.com 1; spf=pass smtp.mailfrom=aist.go.jp; dmarc=pass action=none header.from=aist.go.jp; dkim=pass header.d=aist.go.jp; arc=none
  • Arc-message-signature: i=1; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com; s=arcselector9901; h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-SenderADCheck; bh=3g4v7LXxk7YdpXTZpa9DWoecw3vmA6hzUh3y3CzSLTA=; b=Iy8De9J375WlOLbvuCO7Et71UBhXxROSPmFmx5Vl3uh+DnyZk3mfi7Mq3zExxVzjaAZxm3+14+ZD/SyR7aVzJLZzQHlwMKj79w1aLNY1EVB/dTMNvy/rG1+2tLIQ1Lk2yYqB6y7p4w/aMbs/HruOHIfrJb2wDzJBEPAKoYxwzFCxT6K20Kbj22JKYyqBmP4KSFQF2rIdvFC4n9QQuvqzh9nGYExdF6Q98jeGGHSo8XCEMof3h1E7pNK61FlDprKvveZHirbtDUh7WgjlI/++hjR2h2I9vWasQ8ZG1lhBZlB3YiHwpixpc+3mc4vd3JDowClOQiPHdzpOyxwdKkXI2Q==
  • Arc-seal: i=1; a=rsa-sha256; s=arcselector9901; d=microsoft.com; cv=none; b=ZhL4BHjXH825hw1Pjg7g3kWdpmRDWiB6muy3LdRfe+8KBcF6XG54JgOZL4gZHgxzx9uHD89xeeQs12NMwC7NeCg9Vg6ksdUterR7y5XfyP0cNKk6fRpKlP2tJ3gdfz5cmpBCOVUkfL50sqb8j5+QGPbBjTQcuqFsbm6Ui7+rAihNnjcNbjM6euzoI3yKwRvHbPigCw1MhqkqeexV1N+doa0kz1lsAQvYVKVzfdGsaN/rAHC//2uqWLSIoVjkU77RttTimUIl5k4MaqHh4d4SxF3ZPbmA7wZ1g22CXGeF1uKA+Ym4KL01/s554oRq4t0lhu4uLwTlI36TNyiEaRXSfg==

┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2021年2月号 ( Vol. 13, No. 7 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

本号では国際会議の参加報告を三件ご寄稿いただきました.著者のご所属が
研究所(ICDM 2020),企業(BigData 2020),大学(WI 2020)と
多岐にわたる報告となっています.

本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する内容
についてご意見がございましたらnews-com [at] dbsj.orgまでお寄せください.

日本データベース学会 電子広報編集委員会

(担当編集委員 佃 洸摂)

===============================================================

----
目次
----

1. ICDM 2020 参加報告
    神田 峻介(理化学研究所)

2. IEEE BigData 2020 参加報告
    田中 茂樹(NTT DOCOMO)

3. WI 2020 参加報告
    本間 涼介(豊橋技術科学大学)

==============================================================

■ 1 ■ ICDM 2020 参加報告
                    神田 峻介(理化学研究所)

11月17日から20日まで開催されたICDM 2020 (20th IEEE International Conference
on Data Mining) に参加しました. ICDMはデータマイニングに関する主要会議のひとつで,
KDDに次ぐレベルという認識が一般的かと思います. ICDM 2020はイタリアのソレントで
開催される予定でしたが, コロナウイルスの影響を受けてオンラインでの開催となりました.
今回の論文投稿数は930件で, レギュラーペーパーとしての採択は91件, ショートペーパー
としての採択も91件で, それぞれの採択率は9.8%でした. トピックとしては, Graph,
Network, Neuralといった語が目立っていました.

ICDMは今回で20回目ということもあり, "20 Years of IEEE ICDM: Retrospect and
Prospect"というパネルセッションがありました. Dimitrios Gunopulos先生, David
Hand先生, Rao Kotagiri先生の3人のパネリストによって, これからの10年間で取り組むべ
き課題やデータマイニングの会議に求められることについての議論が行われました. ICDMの
これまでの貢献やデータマイニングの主要な技術の振り返りなどもあり, ICDMに初めて参加
する私にとっては非常に新鮮で興味深いテーマでした.

オンラインでの開催について, ICDMでは200件近い全ての発表がオーラルなので, テンポよ
くセッションを進行するための工夫がありました. まず, 発表者は事前に録画したプレゼン
動画を提出し, 聴講者は開催の一週間くらい前から発表動画を確認できました. そして, 聴講
者は発表動画を事前に見てきている前提で, セッション自体は質疑応答に集中するという形
式でした. これによって, 会議の一日あたりの開場時間は4〜5時間となり, プログラムによっ
て拘束される時間は短かったです. 日本時間では夜9時からの開場でしたが, 深夜2時にはその
日のプログラムが終了して, 大きく生活リズムを変更することなく参加できました. 時差を考
慮したオンラインだからこその工夫だと感じました.

私の研究に関して, "Dynamic Similarity Search on Integer Sketches"という論文がレギュ
ラーペーパーとして採択されました. 本研究では, ハミング空間での離散系列(スケッチ)に
対する類似検索のためのデータ構造を提案しました. 一般的な問題ですので, これまで多くの
データ構造が提案されていますが, その多くが {0,1} から成るバイナリスケッチに向けて設
計されています. しかし近年のLSH技術の発展により, 整数値から成るスケッチのためのデー
タ構造も重要となっていました. 本研究では, Trieとよばれる木構造をコストモデルに従って
構築することで, バイナリスケッチと整数スケッチの両方で高速に検索可能なデータ構造を
実現しました. 動的な更新が行えることも利点のひとつであり, 逐次的にデータが追加・削除
されるようなデータベースへの応用が可能です.

最後に, ICDM 2021はニュージーランドのオークランドで12月7日から10日までの開催が予定
されています. Closingで流れたニュージーランドの紹介動画がとても素敵でした. 現段階では
現地開催を予定しており, 状況に応じてオンラインやハイブリッドに切り替える予定のようです.
それまでにコロナウイルスが収束し, 無事に現地で開催できることを心より願っております.

(神田 峻介 理化学研究所 革新知能統合研究センター 圧縮情報処理ユニット 特別研究員)

-----------------------------------------------------------------------

■ 2 ■ IEEE BigData 2020 参加報告
                    田中 茂樹(NTT DOCOMO)

2020年12月10日から13日までの間,オンラインにて開催された,The IEEE International
Conference on Big Data(IEEE BigData) 2020に論文がShort paperとして採択されました
ので参加してきました.IEEE BigDataはビッグデータに関するトップカンファレンスの一つ
であり,データマイニング,意思決定,インフラ,セキュリティ,アプリケーションなど多岐
に渡るトピックでの最新手法が提案されました.

IEEE BigData 2020は元々アトランタにて開催される予定でしたが,COVID-19の影響により
オンライン開催となりました.そのため,発表者は事前にプレゼン動画を撮影・投稿し,当日
はZOOM上で進行者が動画を再生した後に質疑にのみ答える形式となりました.また,プレゼ
ン動画はカンファレンスのWEBページで自由に再生出来ましたので,対面でのコミュニケーシ
ョンがなくなったのは残念ですが,興味のある発表を会場や時間の制約なく聞けたのは利点で
した.発表件数はFull paperが83件 (採択率15.5%) ,Short paperが88件 (採択率16.4%)で,
日本人が第一著者の論文はFull paperが1件,Short paperは9件でした.

セッションはSystem for High Performance ML and Numerical Computing, Workflows and
Monitoring, Big Transportation Dataなど多岐に渡り,私はBig Human-Derived Dataという
セッションで下記発表を行いました.
Real-time Karaoke Recommendations: Session-based Multi-Task Recommendations with Multivariate RNNs
この研究では,カラオケにおける楽曲・歌手のレコメンドを目的とし,情報の無い複数ユーザか
ら成るグループに対しリアルタイムに精度高くレコメンドを行う手法を提案しました.機械学習
を用いたレコメンド手法は数多く提案され,ショッピングサイトを始め様々なサービスで実際に
活用されていますが,その殆どは個人を対象とし,過去の購買履歴や性年代等から趣味嗜好をプ
ロファイルしレコメンドを行います.一方でカラオケ店舗等の実店舗においては顧客の属性や履
歴はUnknownであることが多く,かつグループであることを鑑みると,既存手法の適用は困難
でした.そこで,入店から退店までの歌唱履歴を時系列として捉え,楽曲情報や環境情報も加味
することでリアルタイムにグループへの理解を深めることでレコメンドを行うRNNベースのモデ
ルを構築し,オフラインではベースラインの2倍以上の精度を達成しました.また,提案モデルを
実際のカラオケ店舗向けに提供し,RNNベースのリッチなモデルが商用サービスで大量のリクエ
ストを処理可能であること,ユーザの楽曲検索速度が向上し歌唱出来る楽曲数が増えていること
を確認しました.

私の論文は以前KDD2020に投稿しリジェクトされたものを加筆修正し再度投稿したものです.
その際はオフライン評価のみで,デプロイし得られた知見について記載しておらず,査読者から
は有効性への懸念からリジェクトされました.私自身,MAP等のオフライン指標とCTR等のオン
ライン指標に相関がなく苦労をすることがあり,皆さん同じような苦労をされているんだなと感
じつつ,ABテストにお付き合い頂いた第一興商様に感謝しています.
IEEE BigDataでは理論,実践共に非常に面白い論文が数多く投稿されていましたので,ぜひ
投稿・参加をご検討頂ければと思います.


-----------------------------------------------------------------------

■ 3 ■ WI 2020 参加報告
                    本間 涼介(豊橋技術科学大学)

2020年12月14日から17日に開催されたWI-IAT’20(The 2020 IEEE/WIC/ACM International
Joint Conference on Web Intelligence and Intelligent Agent Technology)に採択され,参加
しました.41カ国から574件の投稿があり,うち169件が採択されました.全体の採択率は29%
でした.

WI2020は本来オーストラリアのメルボルンでの開催でしたが,新型コロナウイルスの影響で,
今年はオンラインでの開催となりました.メルボルンは珍しく日本よりも東にあるので,時差は
日本より2時間早いです.よって,学会の開催時間は現地時間で8:45から17:30ぐらい,日本時
間だと6:45から15:30ぐらいとなります.時差の影響でアジア人にとってはKeynoteが朝早くか
ら始まるわけですが,参加者にはアジアの方が多く,全体的にKeynoteの参加者が少なめだった
印象があります.発表方法は,事前に発表動画を作成・投稿し,本番ではチェアの方にその動画
を流してもらった後に,質疑応答をリアルタイムで行うという形式でした.私の発表では投稿し
た動画がチェア側で再生出来ず,急遽ライブ発表になるアクシデントがありました.オンライン
開催によるトラブルも色々とありましたが,現地への移動が不要であったり,個人的には対面より
も質問がしやすいと感じたりなど,オンライン開催によるメリットもあると感じました.個人的に
はオンライン開催は今後も良い選択肢であると思います.

私は「Analysis of Short Dwell Time in Relation to User Interest in a News Application」と
いうタイトルの論文を投稿し,Long Paperで採択されました.本研究は,ニュース記事閲覧にお
ける短い滞在時間に着目した研究です.推薦システムなどの分野で,ユーザエンゲージメントを
測る指標として滞在時間が既に実践的に使われています.しかし,一般的には滞在時間が長いこ
とが良い,短いことが良くないとされることが多いです.そこで,短い滞在時間の場合にもユーザ
エンゲージメントが高い場合があるのではないか?という疑問を出発点とし,短い滞在時間につい
て詳しく分析したのが本研究の主たるモチベーションです.分析そのものだけでなく,ユーザの興
味を可視化できる方法を提案したこともContributionsの1つです.現在は,実際に推薦システム
へ応用する方法について研究をしています.

本研究はBest in Practice Paper Awardを受賞しました.個人的な経験に関して述べさせて頂くと,
国際学会に関しては学部生のときにWork Shopに1本が採択された経験があり,国内に関しても査
読無しで1本採択されたのみであり,論文が採択された経験があまり多いわけでは無いと思います.
Long Paperで採択されることも初めてでしたが,このような賞を頂くことができ,本当に光栄です.
本研究は株式会社Gunosyさんとの共同研究の成果です.Gunosyの関さんにはメンターのような形
で非常に強くサポートして頂き,関さんとは毎週オンラインで進捗報告をしながら研究を進めまし
た.毎週研究について議論できる環境があったことは,研究を進める上で非常に重要だったと感じ
ています.また,テーマ決めに関しても関さんにサポート頂き,なるべく私がやりたいことをやれ
るよう指導して頂きました.関さんのサポート無しには本研究は成り立っていなかったと思うので,
本当に感謝しています.勿論,共著者の方々や研究室メンバーや友人にも感謝しております.あり
がとうございました.

次回のWI2021は再びオーストラリアのメルボルンで,オンラインではなく現地で開催される予定です.


--
佃 洸摂
国立研究開発法人 産業技術総合研究所
人間情報インタラクション研究部門 メディアインタラクション研究グループ 主任研究員
〒305-8568 茨城県つくば市梅園1-1-1 中央第二事業所 2-10棟313号室
TEL: 029-861-3058
URL: http://ktsukuda.me