日本データベース学会

dbjapanメーリングリストアーカイブ(2022年)

[dbjapan] DBSJ Newsletter Vol. 15, No. 3: DASFAA 2022, SDM 2022, ICDE 2022

  • To: dbjapan [at] dbsj.org
  • Subject: [dbjapan] DBSJ Newsletter Vol. 15, No. 3: DASFAA 2022, SDM 2022, ICDE 2022
  • From: Kosetsu Tsukuda <k.tsukuda [at] aist.go.jp>
  • Date: Wed, 1 Jun 2022 11:08:56 +0900
  • Arc-authentication-results: i=1; mx.microsoft.com 1; spf=pass smtp.mailfrom=aist.go.jp; dmarc=pass action=none header.from=aist.go.jp; dkim=pass header.d=aist.go.jp; arc=none
  • Arc-message-signature: i=1; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com; s=arcselector9901; h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-AntiSpam-MessageData-ChunkCount:X-MS-Exchange-AntiSpam-MessageData-0:X-MS-Exchange-AntiSpam-MessageData-1; bh=9SCLJeblqZqsxG4SmbMvvnei6nVHsflbjEr2Cx6CNJ0=; b=nyA9v0GcMOxy0E+c3gMmppDhV7DguL4F2nY6JkSwoD0E/AXJAdvV8ytFp0qa5nuN7Mik1BJC0wDUSX+UliQKfwar1+Ab1YSYF763Z0FaVpUJaGRAViJvirt6dkk1Nh9uoVCOGZVKjmomJrIlCq7TDwFVgux86PkI98omDWrV3GZSrYWmFT00CerEOwysN84wfLxrLeawbWvDneqTxxbpFZ0nNjbqyCBW4K/imjg4pphjqpAw1xq5b+3xogxVWiBBUC/sr26JjnxRQl9UG7WBJuunHKY/deqoh2yCTQPKsA7EJC7YRb5+/O4dnnQMOY2s/W+XQYAbQ5QznVo9mTUi9A==
  • Arc-seal: i=1; a=rsa-sha256; s=arcselector9901; d=microsoft.com; cv=none; b=mMUfTNO2EdUwrDMyXgQJYeHs9h87Cr71uDva3JrD+fQYDmtZyNFkHBTtEmxQMjMpRlmETIf+f9N/+XgJrcw0/ZWmqJYIyTdT1Rb8g03FVfOLQfAT3JxPsvop3JNtBoqQfvVkJO9hVPKmhTbzvxrA5wpEfJQsaKpNfoZWjNlHoKb3UgVw4Ww9MWlnp7pKn6yxeNZxZiSE8ZexdrsdBWhsjFg9kFIscc6FBgT+9jcoewV0vUpS5S2svtrlW8s2Harktm6ouPKgLTOEKXKbr0KxvmmfQiyQ7KzoeSiRcEbk0KbfECEcVmrGeRCsdsIbttqJqx9F6xGkIR+SBakUnuTSEQ==

┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2022年6月号 ( Vol. 15, No. 3 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

本号では,国際会議の参加報告として DASFAA 2022,SDM 2022,ICDE 2022の3件の
ご寄稿をいただきました.会議の様子だけでなく,それぞれの会議でご自身が発表
された研究内容についても詳しく紹介していただいているので,ぜひご覧ください.

本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する内容に
ついてのご意見がございましたら news-com [at] dbsj.org までお寄せください.

                                日本データベース学会 電子広報編集委員会
                                              (担当編集委員 佃 洸摂)

=======================================================================

----
目次
----

1.DASFAA 2022 参加報告
髙⽥ 実佳 (東京⼤学)

2.SDM 2022 参加報告
松田 光司 (大阪大学)

3.ICDE 2022 参加報告
山口 晃広 (株式会社東芝)

=======================================================================

■1■ DASFAA 2022 参加報告
                                                髙⽥ 実佳 (東京⼤学)

2022年4月11-14日までの間,オンラインにて開催された,The 27th International
Conference on Database Systems for Advanced Applications (DASFAA 2022)に参加し
てきました.インドのハイデラバードでの開催予定でしたがコロナの影響によりオンラ
イン開催となりました.Full, short含め研究発表143件,企業発表12件,パネル1件,
デモ11件,併設ワークショップ6件,チュートリアル5件で,研究発表の採択率は29%で
した.トピックとしては,Text, Image, Machine learningが目立っていました.Best
paperはOpen-domain Dialogue Generation Grounded with Dynamic Multi-form Knowledge
Fusionというタイトルで,会話において質の高いダイアログを生成する為にドキュメン
トから知識グラフを元に会話と関連する情報を抽出するモデルの提案に関する論文でし
た.

オンラインの開催について,発表者は発表動画とスライドを事前にアップロードし,当
日,動画が放映され,その後質疑応答をライブで行う形式でした.そのライブ自体も録
画され公開されています.動画トラブル,ネットワークトラブル等が何度か見受けられ
たのが残念ではありました.インド時間での開催だったので,日本との時差は3時間半
だったので時差による困難が少なかったのは助かりました.

5件のキーノートが実施され,Prof.Gautam DasによるFairness in Database Querying
というタイトルでAI/MLの公平性に関する問題提起,研究についての紹介やOracleの
Tirthankar LahiriによるIn-memory database技術動向やOracle製品におけるテキスト
や空間分析,ハイブリッドスキャンにおけるOracleの優位技術の紹介など興味深く,複
雑な処理をシンプルに利用させるコンセプトはとても共感できました.また,Dr. Sunita
Sarawagiによるデータベースシステムに適用しているAI技術でDeep neural networkを
用いたMissing value imputationや BERTのような自然言語処理モデルを用いてテキスト
をSQLに変換するNatural language interfaces over databasesについて紹介されました.

私自身は,”μ-join: Efficient Join with Versioned Dimension Tables”というタイ
トルの論文を,Queriesセッション枠で発表しました.本研究では,バージョン管理され
た複数のディメンション表とファクト表との結合を効率的に実行するμ-joinオペレータ
を提案しました.日々の業務データを記録し増加するファクト表に対し,そのファクト
表を正しく認識する為に必要な業務リソースを管理するディメンション表もバージョン
が更新されることがあります.この為,業務分析の為には,ファクト表の各レコードに
対し適切なバージョンのディメンション表を結合する必要があり,本研究ではファクト
表と複数バージョンのディメンション表の結合を直接実施するオペレータを提案し,従
来のバイナリ結合で生じる不必要な処理を省くことで効率化を実現する可能性を示しま
した.本論文では医療の分析例やデータを用いていますが,医療分野のみならず多くの
分野での適用が期待できます.

最後に,来年DASFAA2023が中国の天津での開催が案内されました.中国の古い歴史を感
じられる都市ということで,来年までにコロナが収束し,無事に現地で開催される事を
願っています.

(髙⽥ 実佳 東京⼤学)

--------------------------------------------------------------------

■2■ SDM 2022 参加報告
                                                松田 光司 (大阪大学)

2022年4月28日から30日に開催された SIAM International Conference on Data Mining
(SDM22) に論文が採択されましたので,参加してきました.SDMはデータマイニングに関
する国際会議の一つです.

SDM22は本来アメリカのバージニア州とオンラインとのハイブリッドで開催される予定で
した.しかしCOVID-19の影響で現地での参加希望者が少なかったため,開催の1週間前に
完全オンラインでの開催に変更されました.発表や質疑応答は,どちらもライブ形式で
した.私は学部時代も含めCOVID-19の影響で現地での学会発表をしたことがなかったの
で,今回も現地参加できなかったのはとても残念でした.オンラインだと興味のある発
表を気軽に聞くことができるというメリットがありますが,修了までには学会に現地参
加したいです.

私の論文は「FedMe: Federated Learning via Model Exchange」というタイトルで,フ
ルペーパーに採択されました.本研究ではモデル構造を自動チューニングする新たなパ
ーソナライズド連合学習手法を提案しました.連合学習はサーバとクライアントから構
成される分散型の機械学習技術で,近年注目されていることもあり様々な研究が行われ
ています.その中でも,クライアント毎にデータの分布が異なるという「データの不均
一性」に対処するため,クライアント毎にモデルを作成するパーソナライズド連合学習
が提案されています.しかし,既存のパーソナライズド連合学習手法ではモデル構造の
決定が困難であるという問題があります.本研究の提案手法では,各クライアントはモ
デルを交換し合い,他のクライアントのモデルを参考に自身のモデル構造をチューニン
グします.こうすることで,モデル構造の自動チューニングが可能となります.

今回の論文はCIKM2021でリジェクトされたものを修正し,再度投稿したものです.査読
ありの学会への投稿はCIKM2021が初めてだったので,もちろん論文をリジェクトされた
のも初めてでした.そのためすごく落ち込みましたし,次の投稿で採択されるためにど
のように修正すれば良いか分からなくなった時期もありました.助教の佐々木先生や准
教授の肖先生,教授の鬼塚先生にさまざまなご指摘をいただき修正を重ねることで,
SDM22に採択されることができました.本当にありがとうございました.

最後に,SDM23はアメリカのミネソタ州で2023年4月27日から29日の期間で開催される予
定です.それまでにはコロナウイルスが落ち着いて現地参加希望者が増え,無事に現地
で開催できることを心より願っております.

(松田 光司 大阪大学)

--------------------------------------------------------------------

■3■ ICDE 2022 参加報告
                                                山口 晃広 (株式会社東芝)

2022年5月9日から12日まで開催されたIEEE International Conference on Data
Engineering (ICDE) に参加しました.ICDEはSIGMODやVLDBに並ぶデータベース分野の
三大会議の一つであり今回で38回目の開催になります.採択された件数は,研究トラッ
クで211件(採択率27.1%),産業トラックで34件(採択率28.6%),デモトラックで16
件(採択率34.8%)でした.研究トラックの投稿数は昨年の549件と比べて今年は780件
と増え,本会議への関心の高さが伺えます.

査読プロセスには,論文投稿の約1ヶ月後に1次通知,その約5日後にリバッタルの締切,
その約2週間後に2次通知(採択/条件付/不採択)があり,条件付の場合は査読者から
の指摘に質問できる機会もありました.私にとってはこれまで査読者と短期間に何回も
やりとりする機会が無くハードなものでしたが共著者の先生にサポートをいただき貴重
な経験とともに何とか乗り切ることができました.

今年もコロナの影響で完全にオンライン会議となりました.時差も殆どなく自宅から参
加できるため私にとってはありがたかったです.セッションの大きな傾向としては,デ
ータ管理システムやそれに関するクエリ処理などの研究と,情報検索や推薦などを含む
データマイニングの研究がありました.また,データベースのチューニングに機械学習
を用いるチュートリアルやセッションもあり,KDDなどの純粋なデータマイニング系の
国際会議とは異なる特色がありました.

私は研究トラックにおいて時空間データマイニングというセッションで発表しました.
本セッションの発表12件のうち,約半数が交通など人々の活動を時空間上で予測する研
究であり,残りの約半数が時系列データを対象とした異常検知やクラス分類(時系列分
類)の研究でした.私の発表は「Learning Evolvable Time-series Shapelets」という
タイトルで時系列分類手法の中のshapelets学習法についての提案でした.ここで,
shapeletsとはクラス分類に用いる複数の短い波形パターンであり,shapelets学習法と
は機械学習によりshapeletsを発見する手法です.インフラ設備や製造装置にセンサを
取り付けて異常診断を行う際,専門家は波形に対して専門知識を保有している場合が多
く,専門家にAIの判定根拠となるshapeletsを提示することが有効です.そのため,最
近はshapelets学習法を中心に研究しています.従来の時系列分類の問題設定とは異な
り,本研究では時系列データを取得するタイミングにより時系列波形が変化することを
考慮し,shapeletsを発見するだけでなくそれらの変形も予測する技術を提案しました.
今後も,本分野の発展に貢献していきたいです.

(山口 晃広 株式会社東芝)

=======================================================================