日本データベース学会

dbjapanメーリングリストアーカイブ(2021年)

[dbjapan] DBSJ Newsletter Vol.14, No.5: EDBT2021, SIGMOD2021, SIGIR2021, IJCNN2021参加報告


┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2021年8月号 ( Vol. 14, No. 5 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

本号では国際会議EDBT/ICDT 2021,SIGMOD/PODS 2021,SIGIR 2021,
IJCNN 2021の参加報告をご紹介致します.

本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する内容
についてご意見がございましたらnews-com [at] dbsj.orgまでお寄せください.

日本データベース学会 電子広報編集委員会

(担当編集委員 天方 大地)

===============================================================

----
目次
----

1. EDBT/ICDT 2021参加報告
     佐々木 勇和 (大阪大学)

2. SIGMOD/PODS 2021参加報告
     天方 大地(大阪大学)

3. SIGIR 2021参加報告
     加藤 誠(筑波大学)

4. IJCNN 2021参加報告
     Yihong Zhang(大阪大学)

===============================================================

■1■ EDBT/ICDT 2021参加報告                                 佐々木 勇和 (大阪大学)

EDBT/ICDT2021に参加報告致します.

EDBT/ICDTは大規模すぎず小規模過ぎず,理論から実践まで幅広いDB技術

をカバーしており個人的にはかなり好きな会議です(開催場所も魅力的な

合も多いです).

 

第24回目となるEDBT/ICDT2021は3月23日から26日にCyprusのNicosiaでの

開催予定でしたが,オンラインでの開催でした.オンライン会議は海外渡航

の時間的制約から解放され身体的には楽なのですが,研究者と知り合いにな

ためのネットワーキングには限界があるなと感じております.

EDBT2021の内容について簡単にまとめます.まず招待講演として5件の発

表がありました.YouTubeに動画が上がっているものもあります(全てで

はありません).


1. ICDT invited talk: What Makes a Variant of Query Determinacy (Un) Decidable?
Jerzy Marcinkowski (University of Wrocław, Poland)
2. EDBT keynote 1: The Quest for Knowledge. Katja Hose
(Aalborg University, Denmark)
3. EDBT keynote 2: Explainability Queries for ML Models and its Connections
with Data Management Problems. Pablo Barceló (Pontifical Catholic
Universityof Chile, Chile)
4. EDBT keynote 3: Data Profiling – A look back and a look forward. Felix
Naumann (Hasso Plattner Institute, Germany)
5. EDBT keynote 4: Comparing Apples and Oranges: Fairness and Diversity in
Ranking. Julia Stoyanovich (New York University, USA)

王道なデータベース研究である問合せ処理に加えて,知識グラフや,機械

学習モデルの説明可能性,検索ランキングの公平性という最近の流行に即

したものが含まれています.特に,Julia Stoyanovich (SIGMOD2020でも

キーノート)のプレゼンは問題の重要性もわかりやすく面白かったです.

研究セッションとしては,データ分析と機械学習系が若干多いかなという

印象ですが,そこまで大きな偏りはなかったように思います.私としては

グラフデータベースの研究が多かったのが嬉しかったです(グラフセッ

ションだとマイニングやアルゴリズム研究が多い).Short paperのBest

paperもグラフデータベースに関する研究でした.

私はデモセッションにてSmart City Data Analysis via Visualization of
Correlated Attribute 
Patternsというタイトルで発表しました.

時空間パターンマイニングを可視化するシステムを作って実際に分析

しました,というのが論文の骨子です.今年のデモではデータベース

分野外とのコラボレーションが望ましいとのことで,環境学と都市交

通の研究者との共著論文になっています.実際に中国で取得されたス

マートシティデータをデモシステムの応用例として用いて分析も行い

した.オンライン開催ではあまりデモに人が来ないということは

想していたのですが,予想通り2名しか来ず,何とも寂しいデモでした.


EDBT/ICDT2022はイギリスのEdinburghで3月29日から4月1日の開催

予定です.EDBT2022では投稿締切が年3回(6月,10月,2月1日締

切)になり,以前と投稿スタイルが変わっております(6月は既に過

ぎてますが).2月の投稿は2023での発表になりますのでご注意く

ださい.ICDTも年2回の投稿締切(4月と9月)があります.EDBTで

は年度内に2回投稿することも可能になったようです.今まで1月か

ら5月まではあまり良い投稿先がなかったので,2月に締切が追加

されたのは嬉しいところです.これで,主要なデータベースの会議

(SIGMOD, VLDB, ICDE, EDBT, PODS, ICDT)は全て複数回締

になりました.これにより,データベース分野の研究がより盛り上

がってくれたらよいなと思っております.

---------------------------------------------------------------

■2■ SIGMOD/PODS 2021参加報告                                天方 大地 (大阪大学)

2021620日から25日にかけてACM SIGMOD/PODS 2021に参加しました.
幸運なことに,SIGMOD2021では私の主著の論文が2本(密度ベースクラスタ
リングの高速化・距離ベースアウトライア検出の高速化に関する成果)採択さ
れて発表を行うことができたため,ここで参加報告をさせて頂きます.

SIGMOD/PODS 2021はオンラインと現地(中国の西安)のハイブリッド形式
で行われました(現地参加はおそらく中国の方々のみです).参加登録をした
場合は主にWhovaZoomでインタラクションを行い,参加登録をしていない
場合もYouTubebilibiliで発表を聞けたようです(参加登録者数は報告されま
せんでした).また,アジア(北京)時間と欧米時間を考慮して,12時間イン
ターバルで各セッションを繰り返す 2-run 制が採用されました.

SIGMODの投稿カテゴリには変化があり,所謂Research Trackが,Data
Management TrackData Science and Engineering Track,およびApplication
Track3つに分かれました.各トラックでページ数の制限が異なり,これまで
SIGMODよりもスコープを広げるために採用されたようです.一方で,プロ
グラム構成はほぼ例年通りですが,SIGMODのセッションの並列数が4に削減
されました.採択された研究カテゴリは例年の流れが顕著に現れており,デー
タベースへの機械学習応用とブロックチェーンに関する研究が多く見られまし
た.SIGMOD2021のベストペーパー(Bao: Learning to Steer Query Optimizers
もリレーショナルデータベースと機械学習に関する内容です.各セッションは
著者によって事前撮影された5分のプレゼン動画が流された後,リアルタイムで
の質疑応答が行われる,といった形式でした(別途20分のプレゼン動画も用意
され,ACM Digital Libraryで閲覧可能です).

今年のPCチェアが特に強調していた点は(ここ数年で同様の言及はあったよう
ですが) Review to Accept でした.特にトップ会議ではReview to Reject (悪
く言うと,欠点を粗探しする)が暗黙的に行われてきたようですが,SIGMOD
では採択率をコントロールせず,良い(と評価された)論文は全て採択すると
いう方針が掲げられています.それを表しているのが今年のOverall Evaluation
のオプション(Accept/Minor Revision/Major Revision/Reject)であり,3/4
(少なくとも見た目には)採択に繋がる評価であった点のように思います.
(もはや論文誌のプロセスですが,第1回投稿版でRevision判定であった論文
は,2ヶ月強のリビジョン期間で査読コメントに基づいた改訂・投稿を行い,
2度目の判定を経て最終結果が通知されます.)この方針の影響もあってか,
今年のResearchペーパーの採択率は約41%と,例年と比較すると驚異的な数
値でした.また,Senior PCによる「レビューのレビュー」も行われたよう
で,全著者の満足度(≒レビューが建設的なフィードバックになること)
向上と近年問題となっている low quality review にかなり気を遣ったようです.

来年のSIGMOD/PODS6月中旬にフィラデルフィアで開催予定です.
新型コロナウイルスの影響がどう続くかは予測できませんが,興味深い研究が
多く発表されることは間違いないので参加を検討してみてはいかがでしょうか.
---------------------------------------------------------------

■3■ SIGIR 2021参加報告                                      加藤 誠(筑波大学)

2021711日から15日までの間,オンラインにて開催された,The 44th

International ACM SIGIR Conference on Research and Development in

Information Retrieval (SIGIR 2021)に参加してきました.SIGIRは毎年開催

される情報検索に関するトップ会議で,本来であれば今年はカナダのモン

テリオールで開催される予定でした.

 

SIGIR 2021は開始時点で929名の参加登録があり,特にアメリカおよび

中国からの参加数が際立っていました.今年のFull paperの投稿数は720

件で,このうち151件(21%)が採択されました.著者の国・地域で最

も多かったのは中国(1,982著者),ついでアメリカ(507著者),イ

ギリス(132著者),シンガポール(92著者),オーストラリア(89

著者),インド(76著者),ドイツ(68著者),カナダ(62著者),

日本(49著者)でした.今回初の試みとして,投稿区分としてResource

paperPerspective paperが新設されました.他の分野(自然言語処理

Resource paperVLDBVision paperなど)では行われていた試み

ではあると思いますが,データやツールの構築をより重要視し,新し

い方向性に関する議論を歓迎しようとする意図が感じられました.

会議中の口頭発表セッション(Full paperおよびACM Transactions on

Information Systems採択論文)としては以下のセッションがありまし

た(括弧内の数字は同名のセッション数): Bias and counterfactual

learning (2), Recommendation (4), Searching and ranking, Social

aspects, Knowledge structures, Applications (3), Time matters,

Question answering, Conversational IR (2), Neural IR, Cross-domain IR,

Diversity and novelty, Multi-modal IR, Exploration and cold start, Mining

and classification, Click models and prediction, Efficiency, Learning to rank,

Legal IR, Fairness, Adversarial IR, Multimedia IR, Reinforcement learning

and bandits, Natural language and semantics, IR Models, and Evaluation. 

個人的に目新しさを感じたトピックとしては,1) 公平性とバイアス,

2) 会話的検索,3) 法律系文書検索,がありました.ただし,どのトピッ

クも今年初めてというわけではなく,(複数)セッションを構成するほ

ど,論文数が増えてきているという点で際立っていたと思います.

 

SIGIR 2021では,3年に1度選出されるGerard Salton Awardの発表があり,

ChengXiang Zhai教授(University of Illinois at Urbana-Champaign) が受賞さ

れました.Zhai教授は,言語モデルに基づく情報検索モデル(TF-IDF

BM25に加えてApache Luceneなど一般的な検索ライブラリでも実装され

る検索モデル)についての基礎を確立し,また,公理に基づく検索モデ

ルの構築などでも知られています.また,SIGIR 2014にて,Test of Time

Award10年ほど前の論文の中から特に影響の大きかった論文に与えられ

る賞)を「Beyond Independent Relevance: Methods and Evaluation

Metrics for Subtopic Retrieval」というSIGIR 2003の論文について受賞し

ており,検索結果多様化の研究に与えた貢献も大きいと思われます.

Zhai教授の受賞記念講演に加えて,Eszter Hargittai教授のコロナ禍での情

報探索行動,Hang Li博士の対話技術の今度の方向性,Helen Nissenbaum

教授の検索結果個人化についての倫理的問題に関する基調講演がありました.

 

私は今回のSIGIR 2021にて,「Session 4C – Learning to rank」の座長と

Resource paperの発表をいたしました.オンライン学会では,つい会期中

にも予定を入れてしまって,なかなか本腰をいれて参加するのが難しいで

すよね.私も座長をするセッションには,質問をしなければという強迫観念

から論文まで読み込んで参加したのですが,それ以外のセッションにはほ

とんど参加できませんでした.Learning to rankというセッションでは,

株式会社サイバーエージェント/早稲田大学所属の富樫 陸さんによる

Scalable Personalised Item Ranking through Parametric Density

Estimation」という発表を始め,オンラインランキング学習やランキング学

習に基づく推薦アルゴリズム,地図検索や数式検索など,ランキング学習

について非常に多様な論文が発表されていました.今回の口頭発表セッショ

ンでは,持ち時間10分で発表3分(聴衆はあらかじめ15分ほどの発表ビデオ

を視聴してくることが求められる反転授業形式),質疑7分であったため,

聴衆の中に特に近い分野の研究をしている人がいた場合には非常に意義の

ある,深い議論がなされていました.

 

私が発表したResource paperは以下の論文です:

Makoto P. Kato, Hiroaki Ohshima, Ying-Hsang Liu, Hsin-Liang Chen. A Test

Collection for Ad-hoc Dataset Retrieval, SIGIR, pp. 2450–2456, 2021.

こちらの論文は,NTCIRという情報アクセス技術の評価に関するワーク

ショップにて構築された,データセット検索のためのテストコレクション

(ベンチマーク)に関する論文になっています.現在ウェブ上にはさまざま

なデータセット(研究データや機械学習のためのデータ,政府統計データな

ど)が公開されていますが,そのようなデータセットに対する検索アルゴリ

ズムについてはあまり研究が進んでいません.そこで,我々は,第15回目の

NTCIRにて「Data Search」という共有タスクを提案し,テストコレクショ

ンを構築して,共有タスクに参加した参加者の検索システムを評価しました.

この論文では,テストコレクションの構築方法および評価結果の分析結果

について書かれています.もしご興味があれば 

https://doi.org/10.1145/3404835.3463261 にて動画視聴ができますのでご覧

ください.また,現在進行中の第16回目のNTCIRでは,Data Search 2

 ( https://ntcir.datasearch.jp/ ) という共有タスクを実施しておりますので,

情報検索に興味のある方はぜひご参加いただければ大変ありがたく存じます.

 

最後に,SIGIR 2022はスペイン,マドリードで開催される予定だそうです.


---------------------------------------------------------------

■4■ IJCNN 2021参加報告                                   Yihong Zhang(大阪大学)

I attended IJCNN 2021 during 18-22 July.
I will give a brief report on my attendance below.

1. About the Conference
International Joint Conference on Neural Networks (IJCNN) is the flagship
annual conference of the International Neural Network Society (INNS) - the 
premiere organization for individuals interested in a theoretical and
computational understanding of the brain and applying that knowledge to
develop new and more effective forms of machine intelligence. It is widely
considered as one of the premier conferences specialized in neural network,
comparable to NeurIPS, ICANN, and ICONIP. Its papers cover a range of topics
in neural network researches, such as neural network models, machine
learning, computational neuroscience, neuroengineering, and applications.
Many renowned computer scientists in the field attend and give talks in this
conference. At the same time, the conference accepts a relatively large
number of papers from starting researchers. In the 2021 edition, IJCNN
received 2,032 papers submitted by 7,743 authors from over 74 different
countries, and accepted 1,183 papers (59.3%).
In past editions, the accepted papers were separated into oral and
poster papers, and the acceptance rate of oral papers was around 33% over
the years of 2017 to 2019. This year, due to the going pandemic and the virtual
format, oral and poster papers were not distinguished, resulting in a high
acceptance rate of combined categories. While attending the conference,
I saw that many paper presenters were bachelor and master students. Thus
I had an impression that this is a high quality conference, and at the same
time it is also friendly for early-stage researchers.

2. Virtual Attendance
This year IJCNN was held virtually. A website was specifically setup for the
conference. Upon opening the website, attendees could see welcome
messages, program schedule, attendee lists and some other functions in a
menu. They could find sessions and specific presentations from the schedule. 
Except for plenary speeches, the presentations were mostly pre-recorded.
Upon clicking a specific presentation, attendees could see the information
about the paper such as authors and abstract, and they could also play the
pre-recorded presentation. When attendees opened a session during the
scheduled time, they can see the live session. Although presentations in the
live sessions were also pre-recorded, authors could answer the questions
from the audience if they were also there. However, I found that authors of
some presentations did not attend the session thus the Q&A parts were
skipped.

3. Plenary Speeches
There were 7 plenary speeches in this year. I will briefly introduce three of them.
The first speech was given by Professor Marios M. Polycarpou, an IEEE fellow,
and it was about "smart interactive buildings". Smart buildings are complex
systems consisting of physical-engineered system, communications networks,
and social system. Smartly managing such systems can increase energy
efficiency, living comfort, system robustness and reliability. Professor
Polycarpou demonstrated an air quality monitoring system that uses smart
algorithms to achieve such goals. The second speech was given by Professor
Karl J. Friston, a Fellow of the Royal Society, and an authority on brain imaging.
 The speech was about "active inference", a set of mathematical models
derived from brain behaviors. Essentially, Professor Friston convey through
the mathematical formulation that simplicity plus accuracy is the evidence,
which is the foundation of Bayesian brain. The third speech was given by
Professor Riitta Salmelin, titled "What neuroimaging can tell about human
brain function". In this speech, neuroimaging was explained with the example
of natural language processing in the brain. Professor Salmelin showed
several real neuroimaging examples captured using MEG and fMRI, which
was quite stimulating and provided a sensational understanding in neuroimaging.


4. Our Paper
I presented a paper titled "Using Social Media Background to Improve Cold-start
Recommendation Deep Models", a research I have done with collaborators in
the Hara laboratory, Osaka University. This paper describes an extension to a
well-known neural recommendation model, called NeuMF, adding temporal
information from social media. I have been researching social media as a temporal
information background for a while now, using it in tasks such as event monitoring,
rumor detection, crime prediction, and e-commerce user behavior modeling.
This research was built upon previous cross-domain recommendation system
researches done in Hara lab, and the addition of social media came mostly from
my personal experience. About 8 people were in the session and listened to my
presentation. Unfortunately, the session chair was absent, and none of the
audience asked any questions.

In conclusion, I found attending IJCNN to be mostly a pleasant experience. 
I listened to many inspiring talks and was able to communicate with some
researchers in the field. I hope this report can stimulate some interests for this
conference, which I feel especially friendly for early-stage researchers.
---------------------------------------------------------------