日本データベース学会

dbjapanメーリングリストアーカイブ(2021年)

[dbjapan] DBSJ Newsletter Vol.14, No.1: DEIM2021, データ解析コンペティション, IPSJ-83企業パネル, AAAI 2021, BigComp2021

  • To: dbjapan [at] dbsj.org
  • Subject: [dbjapan] DBSJ Newsletter Vol.14, No.1: DEIM2021, データ解析コンペティション, IPSJ-83企業パネル, AAAI 2021, BigComp2021
  • From: Takahiro Komamizu <taka-coma [at] acm.org>
  • Date: Thu, 1 Apr 2021 07:45:13 +0900

┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2021年4月号(Vol.14, No,1)
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

本号では,国内で開催されたイベント三件,国際会議の参加報告二件を
ご寄稿いただきました.

本号ならびに DBSJ Newsletter に対するご意見あるいは次号以降に期待
する内容についてご意見がございましたら news-com [at] dbsj.org まで
お寄せください.

日本データベース学会 電子広報編集委員会
(担当編集委員 駒水 孝裕)

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

----
目次
----

1. DEIM 2021 開催報告
    横山 昌平(東京都立大学)

2  データ解析コンペティション DB 部会開催報告
    大塚 真吾(神奈川工科大学)

3. 企業研究者パネル開催報告
    欅   惇志(株式会社デンソーアイティーラボラトリ)
    高橋   翼(LINE株式会社)
    鬼塚   真(大阪大学)
    小口 正人(お茶の水女子大学)

4. AAAI2021 参加報告
    塩川 浩昭(筑波大学)

5. IEEE BigComp 2021 参加報告
    楠   和馬(同志社大学)

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

■ 1 ■ DEIM 2021 開催報告
横山昌平(DEIM2021 実行委員長,東京都立大学)

DEIM2021 は 3 月 1 日から 3 日という日程でオンラインで開催されま
した.Web ページ等でご案内の通り,当初は,福島県の磐梯熱海温泉を会
場として,オンラインを併用した『ハイブリッド開催』を目指していました
が,いわゆる『第三波』の影響により,現地開催は断念し,完全オンライン
での開催となりました.疫病が原因とはいえ,現地での対面による質疑討論
(と温泉)を楽しみにされていた方には,直前の変更でご迷惑をおかけしま
した.

そんなこんなで,オンライン開催となった DEIM ですが,このスキームで
の開催も二年目を迎え,また,今回は当初より完全オンライン開催となる可
能性も見越していた事もあり,参加者コミュニケーション促進のための掲示
板・イイねボタンの導入等,新しい施策も取り入れる事ができました.一方
で,ハイブリッド開催の制約により,密が避けられないインタラクティブセ
ッションを廃止し,結果として,発表者の発表機会を減少させてしまった事
は反省点だと考えています.

さて,今回の DEIM では,参加費に関しても重大な変更を行いました.対
面開催の最大の利点は温泉かもしれませんが,オンライン開催の最大の利点
は誰でもどこからでも参加できるという事ではないでしょうか.DEIM はこ
こ最近は参加者 600 人規模で推移していましたが,現地開催の場合は,地
理的・日程的な制約により,参加できない方も多くいるはずです.折角のオ
ンライン開催ですので,現地開催なら参加が叶わなかった方にもリーチしよ
うと,聴講参加を無料にしました.

つまり,有償の発表参加と,無償の聴講参加と分け,発表一件につき一口の
発表参加費のみを徴取するというモデルへと変更しました.これにより,参
加者の皆さんにとっては,指導教員など共著で参加するが発表者では無い方
の参加費が無料となり,全体としては,コスト減となったのではないでしょ
うか.

オンライン開催は会場費が無料なので,コストが殆どかからないと言われて
いますが,10 会場でパラレル発表を行う DEIM の規模になると,そうは
いきません.会場費が掛からない代わりに,オンライン会議ソフトに掛かる
コスト,オンライン会議をホストするネットワーク環境,コンピュータのよ
うなハードウェアのコストが掛かります.また何よりも,それらを実際に運
用する学生アルバイトの皆さんには大車輪の活躍をして頂きました.来年度
以降も,ハイブリッド開催を見据える事になろうかと思いますが,それに掛
かるコストを確保しつつも,なんとか DEIM 参加の裾野を広げる事を目指し,
今回,参加費の改革を行った次第です.

その結果,DEWS・DEIM として初めて,参加者が 1100 人の大台にのりました.
いままでが 600 人という規模ですので,倍に近い規模に拡大した事になりま
す.この数値はコミュニティーの皆様の積極的なご参加の賜物だと考えてい
ます.また,対面での開催よりも,参加者へリーチしづらいオンライン開催
であるにも関わらず,沢山の企業からの協賛を得ました.さらに,NII の
「サイバー大講堂」サービスにより,無償で WebEX 環境を利用できました.
このように,様々な方々の助けがあり,DEIM2021 は盛会のうちに幕を閉じる
事ができました.本当にありがとうございます.

さて,来年の DIEM ですが,実行委員長を産業技術総合研究所の的野晃整
さんにバトンタッチします.DEIM では手元の記録を見る限り,実行委員長
が大学以外から選出されるのは初めてとなります.また,そういう意味では,
今年のプログラム副委員長(コメンテータ担当)は,富士通の金政泰彦さん
にお願いしたのですが,企業からのプログラム副委員長という立場での参画
はやはり DEIM 史上初となります.以前よりご担当頂いている産学連携委員
長の戸田浩之さんを初めとして,今年は例年以上に大勢の企業の方に運営に
ご参画頂いています.ビッグデータ時代と相まって,データベースコミュニ
ティーも拡大し続けています.参加者数だけでなく,参加者の所属大学・
企業・団体数も年を追うごとに増え続けています.DEIM の扱う研究トピック
は非常に多彩ですが,そのイベントを運営する幹事団のダイバーシティも
ますます広がっています.このニュースレターをご覧の皆様にも,今後,
幹事団への参加をお声がけさせて頂く事もあろうかと思いますが,その際は,
ぜひ笑顔で首を縦に振って頂けましたら幸いです.

来年度以降も,まだまだ数年間はコロナ禍に悩まされながらのイベント開催
になろうかと思いますが,一方で,新しい試みを行うチャンスでもあると思
います.参加にあたり,色々と不都合もあろうかと思いますが,1000 人参
加の壮大な実験だとお考えいただき,今後とも DEIM に暖かい声援をよろ
しくお願いします.

(横山昌平 東京都立大学)

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

■ 2 ■ 令和 2 年度 データ解析コンペティション DB 部会開催報告
大塚真吾(神奈川工科大学)

データ解析コンペティションは,「共通の実データを元に,参加者が分析を
競う」ことを目的として,平成 6 年度から毎年開催されています.平成 25
年度からは ACM-SIGMOD 日本支部と日本データベース学会ビジネスインテ
リジェンス研究グループの共同体制で,データベース分野独自の予選会(DB
部会)を開設しています.

今年度の DB 部会の委員構成は,次の通りです.

共同主査:大塚真吾(神奈川工科大学),関根純(専修大学)
  委員:井上潮(東京電機大学),宇田川佳久(東京情報大学),
     鬼塚真(大阪大学),北山大輔(工学院大学),
     莊司慶行(青山学院大学),波多野賢治(同志社大学)(五十音順)

令和 2 年度は 8 月 8 日から翌年 3 月 31 日までの期間で,オリコン
株式会社様にご協力いただき,大規模アンケート調査データの提供を受け,
約 80 チーム,延べ約 550 名が参加しました.

DB 部会の参加は 6 チームで,12 月中旬にウェブ上で中間報告会を行い,
2 月 23 日にオンラインで最終報告会を開催いたしました.DB 部会主査
・委員による厳正な審査の結果,最優秀賞は「個別満足度と総合満足度との
相関関係および企業間のばらつきに基づく企業課題発見ツール CSIMG 」を
発表した DA 研(兵庫県立大学),優秀賞は「顧客満足度ランキング作成
における感情スコアを考慮した自由回答データの定量分析」を発表したチー
ム BJA (同志社大学)と「アンケート自由記述回答の分散表現に基づくカ
フェチェーンの特色抽出」を発表したチーム九段坂(東京理科大学)が受賞
しました.最優秀賞の DA 研は,3 月 15 日にオンラインにて開催された
コンペティション全体の成果報告会(各部会の代表チームが出場)に参加し
ました.惜しくも入賞には至りませんでしたが,DB 部会代表として立派な
発表を行いました.

今回は各チームの解析技術の向上に加えて,特に上位 3 チームは顧客満足
度や自由回答文を綿密に解析することにより,ビジネスに有用な知見を示し
たことが高評価に結び付いたと感じました.一方で,DB 部会への参加チー
ムが少なく,コンペティション全体における存在感がまだ十分ではありませ
ん.このコンペティションは,オープンなデータではなく,企業が実際の業
務で使用している生に近いデータを利用できることが大きな特徴になってい
ます.令和 3 年度も 8 月頃から新たなデータの提供を受けてスタートする
予定ですので,実践的なデータ解析に興味をお持ちの方々は,参加をご検討
ください.

参考 URL は,以下の通りです.
経営科学系研究部会連合協議会: http://jasmac-j.jimdo.com/

(大塚真吾 神奈川工科大学情報学部情報工学科)


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

■ 3 ■ 企業研究者パネル:企業研究者の「熱い想い」をお届けします開催報告
欅 惇志(株式会社デンソーアイティーラボラトリ)
高橋 翼(LINE 株式会社)
鬼塚 真(大阪大学)
小口 正人(お茶の水女子大学)

本会とも強い関わりを持つ情報処理学会の第 83 回全国大会の企画セッシ
ョンにて「企業研究者パネル:企業研究者の「熱い想い」をお届けします」
を企画しました.こちらの企画はもともと DEIM のナイトセッションで脈
々と続けられていた「企業研究者 BoF 」の DEIM2020 向け企画として準
備されていたものの,DEIM2020 が完全オンラインとなり残念ながらキャ
ンセルとなったのがあまりに惜しく,全国大会向けにリブートした企画です.

本企画は「企業 / アカデミアで研究する意義」と「研究テーマの立て方」
の二つのテーマに則ってパネルディスカッションを開催しました.各テーマ
のパネリストの皆様は下記の通りです.情報処理学会の企画ということもあ
り,データベースコミュニティでも馴染みの方に限定せず,各分野で大活躍
されている方々に登壇頂きました.

・企業 / アカデミアで研究する意義
酒井 哲也氏(早稲田大学 基幹理工学部情報理工学科)
牛久 祥孝氏(オムロン サイニックエックス株式会社 Research
                       Administrative Division/Ridge-i)
吉野 幸一郎氏(理化学研究所 知識獲得・対話分野研究チーム)
数原 良彦氏 (Megagon Labs)

・研究テーマの立て方
小山田 昌史氏(日本電気株式会社 データサイエンス研究所
                          プリンシパルリサーチャ)
関 喜史氏 (株式会社 Gunosy Gunosy Tech Lab)
落合 桂一氏 (株式会社 NTT ドコモ クロステック開発部 /
                       東京大学大学院 工学系研究科技術経営戦略学専攻)
竹之内 隆夫氏 (株式会社デジタルガレージ DG Lab 本部
                           Chief Technology Officer (Security))

当日は,事前に募集していた質問と当日の参加者から頂いた質問を織り交ぜ
ながら議論を行いました.聴講者のより多くが興味を持っている質問を採用
し,聴衆にミートした回答をするため,オンライン QA システムである Slido
を利用しました.Slido では参加者が投稿した質問に対して「いいね!」
する機能があり,「いいね!」数が多い質問ほどページ冒頭に提示されるの
で聴衆の興味が可視化されます.また,Slido には投票機能も実装されて
おり,イベント冒頭で参加者に職業についての投票を行いました.学生:企
業研究者・エンジニア:アカポス研究者:その他の比率は 3:4:2:1 とな
っており,この比率を念頭に置きつつ議論を進めました.

当日議論が白熱した議論は「基礎研究の需要」「産と学が連携するために必
要なこと」「ダイバーシティ&インクルージョンについて」「自身の興味と
自社への貢献を両立できるテーマ」などです.パネリストの皆様には多様な
視点でコメントを頂き,参加者の方にとって非常に有用な場となったのでは
ないかと考えております.

さて,COVID-19 によってアカデミックイベントのほぼすべてがオンライ
ン形式となってからもう 1 年以上が経過しました.低コストでイベントに
参加できるようになったり,部分的に参加しやすくなったりとポジティブな
面も多くある一方で,明確な目的のない交流の機会は依然として失われがち
です(得てして新しいアイデア・面白いアイデアはこのような雑談から生ま
れていると言われますが).次回の本家・企業研究者 BoF では是非対面で
の交流「も」できる世の中に戻っていることを切に願います.

・本イベントサイト
https://keyakkie.github.io/ipsj83-industry-panel/


(欅 惇志 株式会社デンソーアイティーラボラトリ)
(高橋 翼 LINE 株式会社)
(鬼塚 真 大阪大学)
(小口 正人 お茶の水女子大学)

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

■ 4 ■  AAAI2021 参加報告
筑波大学(塩川浩昭)

2/2 から 2/9 まで開催されていた AAAI2021 の参加報告をさせていた
だきます.例年数千人規模の参加者が集う AAAI ですが,今年は他の国際
会議と同様に,新型コロナウィルス感染症の影響によりオンラインでの開催
となりました.オンライン会議の構成としては,(1) Plenary セッション
のみ会議参加者用サイトで配信,(2) 個別の研究発表は発表動画を事前ア
ップロードするという形での開催でした.概ね他の国際会議と同様の構成だ
とは思いますが,個別発表については Gather を用いてリアルタイムに質
疑応答できるよう工夫されており,実行委員会の努力を感じられる会議でし
た.参加者の時差の影響もあるためか Gather のアクティブユーザは概ね
500 〜 700 名程度で,例年の盛り上がりと比較するといささか味気ない
印象も持ちました.

●査読プロセスと採択傾向

今年の採択率は Main Track が 19.8% で,概ね昨年の 20.6% と同水
準の厳しい競争があったようです.今年は Main Track とは別に,NeurIPS
や EMNLP 等で高い評価を得たが Reject された論文を対象とした Fast
Track というものも設けられています.こちらの Fast Track に投稿さ
れた論文の採択率は 34.4% と比較的高かったようです.また,日本からの
論文採択率は約 17% でした.アメリカが 25% ,中国が 19% であること
と比較すると,日本からの投稿論文も善戦したのではないかと思います.

今年の AAAI では採択論文や査読の質の向上を目的として,査読プロセス
に大幅な変更が有りました.具体的には,2 フェーズ制による査読プロセス
が新たに採用されています.第 1 フェーズでは各論文に 2 名の査読委員
を割り当てて論文の評価を行います.2 名の委員のうち 1 名以上が 6 点
(Above the threshold of acceptance) であった論文のみ第 2 フェーズに
進みます.Main Track では約 37% の論文が第 1 フェーズでReject となっ
たようです.一方で Fast Track の論文は質が一定程度保証されていると
みなし,第 1 フェーズが免除されています.第 2 フェーズではさらに
2名の査読委員が追加され,合計 4 名の委員によって採否が決定されます.
AAAI は,投稿件数が 7,000 ~ 9,000 件と超巨大な国際会議であるため,
査読レベルのコントロールが毎年課題になっています.今年の方針は玉石
混交の投稿論文の中から良い論文を適切に選定できたと報告されており,
良い感触を感じているようです.

また,今年の AAAI の特筆すべき傾向として,Data Mining や Knowledge
Management 等の DBSJ の皆様にも関連の深いトピックが会議のフォーカ
スとして新たに追加されました.実際に知識データベースを中心としたデー
タベースに関連した論文も AAAI にいくつか採択されて始めています.従
来の AAAI ではデータベースに近いトピックは Out of scope というこ
とで良い評価を得られない場合も多くありましたが,今後は私達のコミュニ
ティからも投稿しやすくなっていくかも知れません.


●セッションの様子

今年は Plenary セッションとして 7 件の招待講演と 7 件のパネルがあ
りました.特に印象に残ったのは CMU の Tuomas Sandholm 教授による
Robert S. Engelmore Memorial Lecture Award の受賞講演です.
同賞は AI コミュニティにおいて学術的ならびに産業的に突出した貢献の
ある研究者に贈られる賞です.講演の主題は革新的なアプリケーションやサ
ービスを作るにはどのようにしたら良いかということで,このテーマになぞ
らえて Sandholm 教授のこれまでの研究を振り返るような講演でした.い
ずれの成果についても繰り返し強調されていた点として,実際のアプリケー
ションやサービスの課題を知ることの大切さです.言い換えると,研究シー
ズだけでは上手くいかないということをおっしゃっていました.例えば,実
際のサービスではスケーラビリティや計算の高速性が重要視される場面が多
々あります.しかしながら,AI コミュニティの研究ではあまりスケーラビ
リティを考慮していないことが多いそうです.Sandholm 教授はこの点に
目を付け,高速な機械学習アルゴリズムや最適化に関する研究に焦点を当て
た研究を行ってきたとのことです.実際に,電子オークションシステムや電
子商取引,臓器移植に関するサービスの立ち上げや起業も行っているそうで
非常に説得力のある話だと感じました.

上記以外の招待講演では,創薬やヘルスケア分野における機械学習の応用に
関する講演や,Pretrained Language Model の最新研究動向に関する
講演など,いわゆるチュートリアル的な講演が多くあり非常に勉強になりま
した.AAAI は例年,幅広いトピックに跨る多くの招待講演を行っているよ
うですので,興味のある方は次回の AAAI への参加をお勧めします.


●私の発表論文

今回は私も Main Track で論文発表する機会を頂いたので,最後に簡単に
紹介させていただきます.タイトルは "Scalable Affinity Propagation
for Massive Datasets" というものです.題目の通り,Affinity
Propagation と呼ばれる有名なクラスタリング手法を高速化するという内容の発
表を行いました.Affinity Propagation は入力データサイズの 2 乗
に比例する計算量を持った,非常に遅いアルゴリズムです.この手法に対し
て,私の研究では特定の条件下では精度を損なわずに計算量を N 分の 1 程
度に抑えられるという性質を発見し,ScaleAP というアルゴリズムを設計
しました.

この研究は昨年 4 月から 5 月の緊急事態宣言下で自宅に籠もっていると
きに行ったもので,様々なコロナウィルス対応等に追われる中で進めた非常
に思い出深い論文です.この研究を国際会議へ投稿するのは AAAI が初め
てであったため,Reject されても仕方ないと考えていたのですが,上述し
た発見を面白いと評価してもらえた点や技術の有用性の高さが査読者に刺さ
ったようでした.結果として,4 名から Accept の判定を頂いて採択に至
りました.多くの方々がそうであったように,未曾有危機の対応で十分な準
備ができない中,何度か投稿を諦めかけていた論文であったため,査読のコ
メントを見たときにはカタルシスを感じるように嬉しかったのを覚えています.


●おわりに

次回の AAAI2022 の詳細はまだ発表されていませんが,例年通りであれば
8 月頃に論文投稿の締切があるのではないかと思います.上述の通り私達
のコミュニティからも徐々に投稿しやすくなってきている印象のある会議で
す.競争率は高いですが,これはと思う研究テーマをお持ちの方は是非投稿
を検討されてみると良いかも知れません.

(塩川浩昭 筑波大学 計算科学研究センター)


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

■ 5 ■  IEEE BigComp 2021 参加報告
楠和馬(同志社大学)

2021 年 1 月 17 日から 20 日に韓国のチェジュ島と Zoom によるオ
ンライン会議のハイブリッドで開催されました.本来はタイのバンコクで開
催される予定でしたが,COVID-19 の蔓延に伴い開催地の変更がありまし
た.2021 IEEE International Conference on Big Data and Smart
Computing (IEEE BigComp 2021) にはちょうど 100 本の論文が投稿
され,レギュラーペーパーとして 24 本(採択率 24%),ショートペーパ
ーとして 20 本(採択率 20%)が採択されました.また,スマートコンピ
ューティングや対話システムなど,ビッグデータを扱った多様な応用技術に
関するような 7 件のワークショップが開催されました.

全日程で本会議セッション 12 件,基調講演 3 件,ワークショップ 8 件,
チュートリアル 2 件が行われました.初日はワークショップ日であり,4
件のワークショップが開催されました.二日目から本会議のセッションが開
始し,この日は 1 件の基調講演と 2 件のチュートリアル,4 件の本会議
セッションが行われました.基調講演は,University of Michigan の
Kang G. Shin 先生による講演で,"Rising Demand for Vehicle Data
and Its Impact on Mobile Computing, Security and Privacy Research" という
題目でした.講演の内容はコネクティッドカーが生成する車両データにより
可能になったモバイルコンピューティング,セキュリティ,プライバシーの
三つの研究分野に関する紹介がありました.コネクティッドカーの普及に
より車両データは 1 台につき 1 時間あたり 25GB の各種データ生成が発生
すると推定されており,会議名に相応しい技術研究に関する紹介でした.
三日目はパネルセッションと 2 件の基調講演,2 件の本会議セッションが
行われました.1 件目の基調講演は,Simon Fraser University の Jian Pei
先生による講演で,"Practicing the Art of Data Science" という題目であり,
Jian Pei 先生が歩まれてきたデータサイエンスに関する研究開発の経験
から得ることができた知見について共有してくださいました.2 件目の
基調講演では,Hamburg University of Applied Sciences の Stephan
Pareigis 先生が,"Autonomous systems in smart cities" という題で講演
なさいました.Stephan Pareigis先生は自律システムに適用される機械学習
技術を研究するために専門の研究室を建設し,ヨーロッパの大都市で普及
しつつあるスマートシティプロジェクトの躍進に向けて,この研究室では
小型の自律走行車を開発しておりその研究内容について講演してください
ました.最終日はパネルセッションと 3件のワークショップ,6 件の
本会議セッションが行われました.

会議論文のレギュラーペーパー 24 本の中から 6 件がベストペーパー賞
(1st Place: 1 件 / 2nd: 2 件 / 3rd: 3 件)を受賞しました.ベストペーパー
賞 (1st Place) は,VEST という大規模センサのためのテンソル因子分解
法を提案し,Pohang University of Science and Technology のMoonjeong
 Park らが受賞しました.他の受賞研究も膨大なデータを効率的に管理・
処理する技術に関する提案が受賞しておりますが,それらが見据えてい
る応用先は多岐にわたるためどの研究分野でも受賞は狙えるかもしれません.

最後に,私は最終日のセッションで発表を行い,聴衆者は 20 ~ 25 名ほ
どでした.私の発表内容はグラフデータベースシステムで利用可能な索引構
造の提案であり,関係辺を辿る処理の効率化が目的です.他のセッションで
は質問が出ていたところはありましたが,セッション全体を通して座長から
の質問しか出ず,活発な議論が行われなかったことは残念でした.会議の空
気感なのかオンライン会議特有の問題なのか定かではありませんが,他の会
議で実施されているように Slack のようなコミュニケーションツールを用
意し,多方面から質問を受けられるようになっていれば良かったと,発表者
として感じました.

(楠和馬 同志社大学)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━


-- 
Takahiro Komamizu
Ph.D. in Engineering
Nagoya University
E-mail: taka-coma [at] acm.org