日本データベース学会

dbjapanメーリングリストアーカイブ(2022年)

[dbjapan] DBSJ Newsletter Vol. 15, No. 1: DEIM 2022, 令和3年度データ解析コンペティションDB部会, WSDM 2022, AAAI 2022


┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2022年4月号 ( Vol. 15, No. 1 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

本号では、開催報告2件、国際会議参加報告2件のご寄稿をいただきました。開催
報告としては、DE系・DBS系の国内最大級の会議であるDEIM Forum 2022、および、
毎年恒例となりました昨年度のデータ解析コンペティションDB部会からの開催報
告となります。国際会議参加報告としては、WSDM 2022, AAAI 2022の2件を掲載
しております。

本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する内容に
ついてのご意見がございましたら news-com [at] dbsj.org までお寄せください。

                                日本データベース学会 電子広報編集委員会
                                              (担当編集幹事 宮森 恒)

=======================================================================

----
目次
----

1.DEIM2022 開催報告
  的野晃整 (産業技術総合研究所)

2.令和3年度 データ解析コンペティション DB部会開催報告
  大塚真吾 (神奈川工科大学)

3.WSDM 2022 参加報告
  佐藤竜馬 (京都大学)

4.AAAI 2022 参加報告
  篠田和彦 (慶應義塾大学)

=======================================================================

■1■ DEIM2022 開催報告
                                          的野晃整 (産業技術総合研究所)

第14回データ工学と情報マネジメントに関するフォーラム
第20回日本データベース学会年次大会(DEIM2022)
https://event.dbsj.org/deim2022/

主催:日本データベース学会
   電子情報通信学会データ工学研究専門委員会
   情報処理学会データベースシステム研究会
日程:2022 年 2 月 27 日(日)〜 3 月 2 日(水)
会場:オンライン開催

○ 開催概要

データ工学と情報マネジメントに関するフォーラム/日本データベース学会年次
大会(DEIM)は、データ工学と情報マネジメントに関する様々な研究テーマの討
論・意見交換を目的とした研究集会であり、当該分野では国内最大規模を誇りま
す。DEIM では、大学・企業の若手教員・研究者・技術者および学生からの発表
の他に、一般からの発表も広く受け付けるとともに、産学連携に向けた活動も盛
んに実施して、深い議論や活発な研究交流を促進しています。また、例年、合宿
形式で開催している点も大きな特徴の一つでしたが、新型コロナウィルス感染症
の拡大を受け、過去 2 年間現地での開催を実現できておりません。今年度こそ
はとハイブリッド開催を目指し、名古屋駅前のウインクあいちを現地会場として
準備を進めておりましたが、いわゆる第 6 波の影響により、現地開催は断念せ
ざるをえず、再び完全オンラインでの開催となりました。

オンライン開催も 3 年目となりそれなりに経験も積んできたこと、また期待し
ていたハイブリッド開催が実現できなかった反動もあって、完全オンラインとな
った DEIM2022 では非常に多くの新たな試みを導入いたしました。具体的には、
4 日間開催、チュートリアルの導入、スペーシャル会議システムの導入、質疑応
答形式の変更、行動ログの取得、トピックの刷新、産学連携の強化、主催団体の
変更、新規参加者の獲得など、非常に多岐に渡ります。

○ 4 日間開催

4 日間開催を導入した最大の理由は、発表時間と質疑応答の時間をしっかり確保
するためです。4 日間の内、プレナリやチュートリアル等のイベントを初日に集
め、従来の研究発表は 2 日目以降に集中して行う形式としました。プレナリイ
ベントはどうしても研究発表時間を逼迫してしまいますので、DEIM2022 では チ
ュートリアルは 4 パラで実施し、プレナリイベントとしては基本的には DBSJ
アワーのみとしました。その結果、質疑時間を含む発表時間は、昨年度では 1
件あたり 15 分だったのに対し、DEIM2022 では 25 分もの時間を確保いたしま
した。

○ チュートリアル導入

DEIM2022 ではチュートリアルを導入しました。チュートリアルは公募と審査の
結果、各分野の専門家の先生方からの非常に興味深い7件ものチュートリアルを
講演いただけました。また DEIM2022 でのチュートリアルは DBSJ の最強データ
ベース講義とのコラボという形で開催させていただきました。そのため一部のチ
ュートリアルは DEIM2022 後も動画コンテンツとして閲覧いただくことが可能で
す。昨年度の招待講演での視聴者数は最大 257 名でしたが、今年度のチュート
リアルでは最大 426 名もの方々にご聴講いただきました。大変好評を博すこと
ができたと考えており、見たいチュートリアルが並列で講演しているために全部
見れなかったという声も聞いています。

○ スペーシャル会議システム導入

DEIM2022 の大きな改革の一つに、スペーシャル会議システムの導入があります。
ここ2年間のオンライン開催では、Webex や Whereby などの一般的なオンライン
会議システムを用いて研究発表を行ってきました。これらの従来のオンライン会
議システムでは、研究発表セッション中の議論には適していますが、その前後に
知り合いと少し雑談するなどの用途には正直不向きでした。このような雑談は現
地開催の一つの魅力であったことを過去 2 年間の経験から学び、DEIM2022 実行
委員会では「雑談の機会増加」を一つの目標として掲げていました。この目標に
対する一つの答えが、スペーシャル会議システム oVice の導入です。

○ 質疑応答形式の変更

oVice の利用は、今年度復活させたインタラクティブ発表と Banquet Online で
の利用を検討していましたが、雑談の機会を増加させるためには、如何にして参
加者を oVice に誘導するかが課題でした。そこで通常の口頭発表の質疑応答も
oVice 上で実施するという決断をしました。質疑応答を従来どおり各口頭発表の
直後にした場合、Webex と oVice を交互に行き来して、非常に煩雑になるため、
思い切って、口頭発表を連続して行い質疑応答はまとめて最後に oVice 上で行
う形式としました。これによって 1 件あたりでは 10 分の質疑応答時間も、ま
とめて並列で行うことでおよそ 1 時間もの質疑時間を確保することに成功しま
した。もちろん、この方式にもいくつもの欠点があることは認識しておりますが、
一つの試みとしては面白かったと感じており、一定の評価を頂けたと認識してい
ます。来年度以降の DEIM でこれらの欠点を少しでも解決されていくことを期待
しております。

○ 行動ログの取得

oVice 関連の新たな試みとしては、実は行動履歴を逐一記録しておりました。一
昨年度から導入している DEIM ポータルシステムではユーザのクリック履歴がす
べて記録されておりますが、これに加えて、oVice での行動履歴、具体的には位
置座標やメッセージ、会議室への入退室等の情報を可能な限り取得しております。
DEIM ポータルに参加登録されたときに、行動ログに関する許諾を頂いたのはこ
のためです。これらのデータは今後の DEIM の改善につなげていくことができれ
ばと考えております。

○ 研究トピックの刷新

DEIM2022 では研究トピックについても大幅な変更を行いました。DEIM の研究ト
ピックについては、DEWS から DEIM に変わった 2009 年度に大幅な変更があっ
た後、2019 年度に食とレシピに関するトピックと機械学習に関するトピックが
追加されたのみで、大きな変更はありませんでした。それを DEIM2022 では実に
13年ぶりに大幅刷新いたしました。全体的に大幅に手を加えておりますが、最も
大きな変更点としては機械学習周りの技術トピックの拡充となります。このトピ
ックの修正がプログラム編成に大きな影響を与えており、毎年プログラム構成に
ついてのご意見が多数でますが、今年度はあまりそういった声を聞いていないの
は、研究トピックの刷新のその一助を担っていると考えております。

○ 産学連携の強化

DEIM2019 から始めた産学連携についても、今年度はより強化するよう努めまし
た。具体的には少しでも多くの協賛企業にリーチするよう、一般に広く募集する
よう変更し、DEIM をあまり存じ上げない企業様であっても、協賛をご検討いた
だけるよう、可能な限り丁寧な対応を心がけました。その結果、昨年度の協賛企
業数がプラチナ 6 件、ゴールド 5 件から、DEIM2022 ではプラチナ 8 件、ゴー
ルド 11 件、シルバー 2 件とほぼ倍増いたしました。当初のハイブリッドの予
定からオンラインに変更になったにも関わらず、非常に多くの企業に多大な協賛
いただきました事を、この場を借りて御礼申し上げます。

○ DBSJ会員権の付与

昨年度からメインの主催団体が日本データベース学会となりました。昨年度は参
加者にとってはあまり大きな違い感じられなかったかと思いますが、この変更に
伴って、DEIM2022 では参加登録された方全員に対して翌年度の学会員の権利を
自動付与する方針になりました。そのため DEIM2022 に参加された方にとって直
接的な影響のある変更点の一つかと思います。

○ 新規参加者の獲得

こういった多くの改革に加えて、DEIM2022 では少しでも参加者の裾野を広げる
ための施策として広告媒体の利用し、2 週間ほど宣伝しておりました。一見大き
な変更点ではないかもしれませんが、おそらく参加者の新規参入に大きく貢献し
たのではないかと思っております。こういった各種改革の結果、オンライン参加
者数の総数は 1376 名となり、昨年度よりおよそ 300 名近くも増やすことに成
功しました。この増加率は 1.25 倍にもなり、前進の DEWS 初期を除くと他に類
を見ない、大幅増を達成しました。

○ おわりに

最後になりますが、このような大規模なイベントを大きな支障もなく最後まで開
催できましたことは、多くの皆様の厚いサポートのおかげです。ご投稿ください
ました著者の皆様をはじめ、多大な支援をくださいました協賛企業 21 社の皆様、
座長・コメンテータとしてご協力くださいました先生方、論文閲読にご協力くだ
さいましたプログラム編集員の先生方、会場選定や各種調達等の支援してくださ
いました関係団体の皆様、各開催拠点でご協力くださいました学生の皆様、各種
運営に携わってくださいました実行委員会の皆様、温かい目で見守ってください
ましたコミュニティの皆様、今回新たにご参加くださいました皆様に、心より御
礼申し上げます。

DEIM2022 では果たすことができなかった 1000 人規模のハイブリッド開催です
が、毎年新たな試みを重ねて常に進化を続けてきた DEIM ですので、必ずや近い
将来に実現できるものと信じております。ここ 3 年コロナに振り回され続けた
DEIM ですが、必ずしも悪い面ばかりではなく、こういった新しい試みがどんど
ん生まれてくるチャンスの面もあります。コミュニティの皆様におかれましては、
次に出てくる試みを心待ちにしていただき、引き続き温かい目で見守ってくださ
いますようお願い申し上げます。

(的野晃整 産業技術総合研究所)

--------------------------------------------------------------------

■2■ 令和3年度 データ解析コンペティション DB部会開催報告
                                              大塚真吾 (神奈川工科大学)

データ解析コンペティションは、「共通の実データを元に、参加者が分析を競う」
ことを目的として、平成6年度から毎年開催されています。平成25年度からは
ACM-SIGMOD日本支部と日本データベース学会ビジネスインテリジェンス研究グル
ープの共同体制で、データベース分野独自の予選会(DB部会)を開設しています。

今年度のDB部会の委員構成は、次の通りです。

共同主査:大塚真吾(神奈川工科大学)、関根純(専修大学)
  委員:井上潮(東京電機大学)、鬼塚真(大阪大大学)、
     北山大輔(工学院大学)、莊司慶行(青山学院大学)、
     波多野賢治(同志社大学)(五十音順)

令和3年度は8月10日から翌年3月31日までの期間で、コネヒト株式会社様にご協力
いただき,新生児・乳幼児の母親をメインユーザとするポータルサイトのデータ
の提供を受け、75チーム、延べ約470名が参加しました。

DB部会の参加は7チームで、12月中旬にウェブ上で中間報告会を行い、2月23日に
オンラインで最終報告会を開催いたしました。DB部会主査・委員による厳正な審
査の結果、最優秀賞は「多くの回答者から回答を得やすい質問の分析」を発表し
たチーム オカピ(兵庫県立大学)、優秀賞は「BERT を用いた共感を求める質問
認識の検討」を発表したTEAM Intellilink(NTTデータ先端技術(株))が受賞し
ました。最優秀賞のチーム オカピは、3月8日にオンラインにて開催されたコン
ペティション全体の成果報告会(各部会の代表チームが出場)に参加しました。
惜しくも入賞には至りませんでしたが、DB部会代表として立派な発表を行いまし
た。


今回は各チームの解析技術の向上に加えて、特に上位2チームは乳幼児を持つ親
からの質問文をBERTを用いて綿密に解析することにより、質問の分類や回答数が
多い質問の傾向を掴むなど、ポータルサイトの満足度向上に寄与する知見を示し
たことが高評価に結び付いたと感じました。一方で、DB部会への参加チームが年
々増加しているものの、他の部会と比べて少なく、コンペティション全体におけ
る存在感がまだ十分ではありません。このコンペティションは、オープンなデー
タではなく、企業が実際の業務で使用している生に近いデータを利用できること
が大きな特徴になっています。令和4年度も8月頃から新たなデータの提供を受け
てスタートする予定ですので、実践的なデータ解析に興味をお持ちの方々は、参
加をご検討ください。


参考URLは、以下の通りです。
経営科学系研究部会連合協議会: http://jasmac-j.jimdo.com/

(大塚真吾 神奈川工科大学)

--------------------------------------------------------------------

■3■ WSDM 2022 参加報告
                                                    佐藤竜馬 (京都大学)

2022 年 2 月 21 日から 25 日にかけてオンラインで開催された International
Conference on Web Search and Data Mining (WSDM) 2022 に参加しました。
WSDM はその名の示す通り、ウェブマイニング・情報検索・推薦・データマイニ
ングを扱う国際会議です。当初はアメリカ・アリゾナ州テンピで開催予定でした
が、新型コロナウイルスのため完全オンライン開催となりました。

【単著複数論文について】

今回私の単著論文が二本採択され発表しました。希少性の高い例かと思うので、
私の経験したトラブルをここに記すことにします。

まず、WSDM 2022 の参加費は、著者で学生の場合 300 ドルです。ここで注意し
ないといけないのは、この参加費は採択論文一本ごとに生じるということです。
なので、二本採択された場合は 600 ドル支払う必要があります。参加費は参加
登録の際に支払うのですが、一回の登録につき一本分しか支払うことができませ
ん。とりあえず一本目の支払いを済ませたあと、二本目の登録にとりかかると、
同じ人物(メールアドレス)からは一回しか登録できないということに気が付き
ました。こういう仕様のシステムらしく、複数本採択された著者は共著者と分担
して登録する運用だそうです。しかし、今回の場合共著者がいないので困りまし
た。運営の方と何度かやりとりした結果、結局新しくフォームを作成してもらい、
そこから登録することで解決しました。前に登録した一本目の返済手続きなども
必要で、お互い大変な作業でした(運営の方、ご迷惑をおかけしました。)

続いてのトラブル。開催間近、スケジュールが発表されると、私のポスター発表
は同一時間帯に別のセッションで登録されていました。つまり二本同時に遠隔の
ポスターを捌かなければいけないということです。オンラインだし、そんなもの
かなと思いつつ、念のため運営に連絡してみると、単一著者複数本というのを想
定せずにスケジュールを組んでいたそうです。結局、別日に移してもらうことが
できました。

教訓としては、小〜中規模の国際会議では単一著者複数本などの特殊ケースは想
定されていない場合もあるので、疑問に思ったら早めに運営の方に相談するのが
よいかと思います。

(佐藤竜馬 京都大学大学院 情報学研究科 鹿島・山田研究室)

--------------------------------------------------------------------

■4■ AAAI 2022 参加報告
                                                篠田和彦 (慶應義塾大学)

【会議概要】

2月22日から3月1日まで開催された36th AAAI Conference on Artificial
Intelligence (AAAI22) に参加してきました.AAAIはAI系トップカンファレンス
の一つで,画像,言語からゲーム理論などの経済学関連のトピックまで,非常に
幅広い分野の研究に触れることができます.昨年の秋頃まではカナダのモントリ
オールで現地開催とアナウンスされていましたが,コロナ・オミクロン株の感染
拡大によりオンラインのみに変更されました.今回は初めて1万の大台を超えた
11,011本もの論文投稿があり,1,370本が採択され,全体としての採択率は15.2%
だったそうです.同じくAI系の国際学会であるIJCAIのように15%を下回っては
いませんが,AI研究への関心の高まりから激しい競争が続いているようです.採
択された論文の75%が学生による研究ということで,AI分野は大学での研究が活
発であると言えそうです.また投稿者の出身国別で見ていくと,中国が投稿数の
40%弱,採択数でも35%を占めており,かなりの存在感を見せつけていました.
ちなみに日本は投稿161本,採択21本とのことで,今後さらに国内のAI研究が盛
り上がっていってほしいと感じました.

【査読プロセス】

最近の機械学習,AI系学会における採択率の低さは投稿数の爆発的な増加を反映
したものですが,学会側としては膨大な数の投稿を捌きながら査読の質を維持す
ることに苦慮しているようです.実際,今回から査読を2つのフェーズに分ける
方法に変更され,試行錯誤を重ねていることが伝わってきました.フェーズ1で
は全ての投稿に2人の査読者が割り当てられ,その評価によっておおよそ半分の
投稿がリジェクトされたようです.フェーズ2では少なくとも2人の査読者が追加
され,それらの査読に対して反論する機会が与えられました.現状の査読プロセ
スを劇的に改善するのは難しいと思いますが,数年前と比較すると着実に前進し
ているのではないかと感じました.

【招待講演】

今回のAAAIで印象に残っている2件の講演について簡単にご紹介します.1件目は
Andrew Ng博士によるData-Centric AI (DCAI) に関する講演です.従来のモデル
・アルゴリズム重視の考え方に対し,DCAIではデータをチューニングすることを
考えます.モデルを固定した上で,データ改善による性能向上を競うDCAIコンペ
も開催されており,今後は研究としても広がっていくのではないでしょうか.2
件目はCynthia Rudin博士によるInterpretable Machine Learning (IML) に関す
る講演です.事故や犯罪の予測などハイリスクな分析に携わってこられた経験か
ら,IMLの重要性について説明されていました.一般には解釈性と性能にはトレ
ードオフがあると考えられがちですが,実問題に対して,ブラックボックスモデ
ルとよくチューニングされたIMLとでは性能にほとんど差がないそうです.倫理
や人命に関わる問題に対処する場合には,プロの知見をモデルに織り込むことが
重要ですが,そこでモデルの解釈性が大きな役割を果たすとのことでした.

【発表内容】

私たちはMain Trackで “Estimation of Local Average Treatment Effect by
Data Combination” という研究について発表しました.この研究は Local
Average Treatment Effect (LATE) というある種の因果効果を複数のデータセッ
トの組み合わせによって推定するものです.LATE推定の既存手法はほとんどが全
てのサンプルにおいて必要な変数が揃っている完全なデータを想定していますが,
現実にはプライバシーや技術的な理由で変数間の紐付けができない事例も多くあ
ります.そこで私たちは紐付けされていない複数のデータセットからLATEを識別
・推定するための新しい方法を提案しました.この問題設定に対応した既存手法
では推定量がミニマックス解として定義されていることから,ハイパーパラメー
タの選択が難しく不安定になりやすい問題がありました.一方,提案手法は重み
付き最小二乗として定式化されており,より安定した推定量を得ることができま
す.本研究で扱ったような複数データセットからの推論は,様々な設定やアプロ
ーチが考えられる上,実用上よく直面する課題であることから,研究・応用の両
面で面白みを感じられるテーマだと思います.興味のある方は例えば The
Econometrics of Data Combination (Ridder and Moffitt, 2007) を参照してみ
てください.

(篠田和彦 慶應義塾大学)

=======================================================================