日本データベース学会

dbjapanメーリングリストアーカイブ(2018年)

[dbjapan] DBSJ Newsletter Vol. 11, No. 4


┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2018年8月号 ( Vol. 11, No. 4 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

国内外で猛暑に見舞われ,熱中症等に関する報道が相次いでおります.
皆様体調には十分お気をつけ下さい

本号では,国際会議の参加報告を3件,データベース学会に関連する研究会の
ご案内を1件ご寄稿いただきました.
国際会議に関しましては, 6月に開催されたSIGMOD/PODS2018,ICMR2018
および7月に開催されたICDCS2018のご報告です.

本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する
容についてのご意見がございましたらnews-com [at] dbsj.orgまでお寄せください.

                日本データベース学会 電子広報編集委員会
                      (担当編集委員 天方 大地)

========================================================================

----
目次
----
1.SIGMOD/PODS 2018 参加報告 
  佐々木 勇和(大阪大学)

2.ICDCS2018 参加報告
  前川 卓也(大阪大学)  

3.ICMR2018 参加報告
   劉 健全 (NECバイオメトリクス研究所/主任)

4.データシステム研究へのお誘い(BDI/xSIG/VLDB突破会)
  川島 英之(慶應大学) 

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

■1■ SIGMOD/PODS 2018 参加報告  
佐々木 勇和(大阪大学) 

2018年6月10日から15日に,アメリカ・ヒューストンにて開催されたSIGMOD/PODS
2018についての参加報告を致します.SIGMOD/PODSはデータベースのトップ会議です.
SIGMODはシステムやアルゴリズム等の実践的な研究が多く,PODSは計算量の解析
などの理論的な研究が多いという違いあります.SIGMOD2018の投稿数は461件で
採択数は90件(20%),PODS2018の投稿数は83件で採択数は29件(35%)でした.
どちらも日本からの論文の採択はありませんでした.日本からの投稿はPODSは2件と
投稿自体も少なかったです.SIGMODの方は国毎の投稿件数の紹介はありませんでした.
SIGMOD/PODSともに年に二度の投稿機会がありますので,日本からも積極的に投稿
したいところです.特に,PODSの方は全体的に年々投稿数が減っているそうです.
もう一つのデータベースの理論系のトップ会議であるICDTと合わせると,
3カ月毎に投稿できるから積極的に投稿してほしいとのことでした.

本報告においては,SIGMOD/PODS2018のキーノートと全体の傾向について報告
します.SIGMODでは2件のキーノートがありました.1つ目はEric Brewerの
"Kubernetes and the New Cloud"です.Dockerとlinux containerに代わる新たな
googleのフレームワークKubernetesの紹介で,技術的な話というより,サービス紹介のような話
が主でした.質疑は非常に活発に行われて,実際にクラウドを用いてる企業が興味あり
そうな様子でした.2つ目はPedro Domingosの"Machine Learning for Data
Management: Problems and Solutions"で,機械学習とデータベースの融合の
話です.Deep Neural Networkは,independent and identically distributed (iid)を
ベースに学習していますが,複数のテーブルからなるデータベースからデータを取り出すと
ジョインの影響により実際はそうなっていないということでした.技術的にはTractable
markov logicを用いて,実際にRDBMSバックエンドでウェブから収集した情報から
知識ベースを抽出したという話でした.
PODSのキーノートは,Michael Benediktの"How Can Reasoners Simplify
Database Querying (And Why Haven't They Done It Yet)?"です.
computational logicの技術をクエリ最適化への応用に関する歴史の話で,
理論と実用化の隔たりに関して話しておりました.ペーパーが15ページと普通の技術
論文レベルの長さがあるので,興味のある方は読んでみてください.
ちなみに,SIGMODのキーノートはどちらも1ページです.

最後に全体の傾向ですが,機械学習の技術を用いたものが多くなってきていました.
データベースにおけるタスク(例えばクエリの最適化やエンティティマッチング)を機械
学習で行うのが主流のようです.また,データ構造の簡約化に関するトピックも
多かったです.Data sketchやsuccinctの論文が多く,SIGMOD
のベストペーパー"SuRF: Practical Range Query Filtering with Fast Succinct
Tries"もsuccinctデータ構造を用いた技術でした.

SIGMOD/PODS2019はオランダ・アムステルダムでの開催です.SIGMOD/PODS
は非常に論文のレベルも高く,デモやチュートリアルも面白い物が多いです.
興味がある方は参加されてみてはいかがでしょうか.

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

■2■ ICDCS 2018 参加報告  
前川 卓也 (大阪大学)  

2018年7月2日から5日にかけてオーストリアのウィーンで開催されたIEEE International
Conference on Distributed Computing Systems (ICDCS 2018)の参加報告
を行う。ICDCSは、分散コンピューティングの分野における最重要会議であり、今年の
参加者数は300人超であった。また、論文の採択率は20.6%(78/378)であり、
例年に比べてややhealthyな数字だったそうだ。投稿を国別に見てみると、米国が160
件超と最も多く、その次が中国で140件であった。3番目が20件超の英国となっており、
米国と中国の投稿数が抜きん出て多いことが分かる。日本からは15本程度の投稿が
あったようで、うち2本の採択は両方とも大阪大学からによるものであった。二年前に
ICDCSが関西で行われたというのもあり、投稿気運が高かったものと推察される。
採択された論文のトピックの中では、クラウドやデータセンター、セキュリティに関するものが
最も多かったようで、その次にビッグデータの分散処理関連の論文が続いていた。

今回のICDCSの招待講演はFraunhoferのManfred Hauswirth氏による「Been there,
done that, bought the t-shirt: Trends in distributed systems architecture」という
演題のものだった。自動運転やスマートファクトリーなど、さまざまなネットワーク応用が生ま
れつつあるなか、アプリケーションにスペシフィックなネットワークではなく、さまざまなアプリケー
ションに適応可能なネットワークプラットフォームが重要となり、それを実現するSoftware 
Defined NetworksやNetwork Function Virtualizationなどの基盤技術が不可欠に
なるとのことだった。また、ICDCSのセッションは概ね4、5パラレルで行われていたが、
Blue-skyというリサーチビジョンのセッションが特徴的であった。要するに大御所の
先生方が当該分野の将来の方向性に関して講演するセッションであるが、私は今回
が初めての参加であったため分野の大まかな概要や方向性が掴めたため有意義であった。

最後に、我々の発表した研究に関して紹介したい。我々の論文は「Boqi Gao, 
Takuya Maekawa, Daichi Amagata and Takahiro Hara: Environment-adaptive 
Malicious Node Detection in MANETs with Ensemble Learning」で、
「Mobile & Wireless Network Computing」というセッションにおいて第一著者の
学生のBoqi Gaoが発表した。本研究は、モバイルアドホックネットワークにおける
Maliciousなノードの検出を機械学習を用いて行うものであり、ノードの密度や平均
移動速度が異なる様々な環境でもうまく動くロバストな検出器をアンサンブル学習を
基に構築している。

私はユビキタスコンピューティング分野の人間であるため、ICDCSに投稿するのは初めて
ではあったが、会議特有の論文の書き方が必要であるようには思わなかった。機械学習
の部分はある程度丁寧に説明したが、一般的な書き方をすれば十分であるように思う。
ただ、私はアドホックネットワークに関してはずぶの初心者であり、その部分に関する記述
は共著者の天方大地助教にお願いした。それなりに採択率が低い会議であるため、
分野外の人間がある程度の質を保った論文を投稿するためには、当該分野の研究者
との綿密な協力体制が必要かと思われる。

次回のICDCS2019は米国・テキサスで行われる。
アブストラクト登録締め切りは1月5日、論文投稿締め切りは1月12日となっている。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

■3■  ICMR 2018 参加報告
劉 健全  (NECバイオメトリクス研究所/主任)  

ICMRとは
---------
ICMR は ACM International Conference on Multimedia Retrieval
の略であり,ACM主催のマルチメディア・データに関する情報検索を中心とした最も歴史
が長い国際会議の1つです.その前身であった国際ワークショップMIRを含めて今年の
ICMR 2018は第19回を迎え,2018年6月11日から14日まで横浜で開催されました.
IEEE Fellowである東大の相澤清晴教授およびNIIの佐藤真一教授がジェネラル
チェアを務められ,お二方のリーダシップにより,ICMR 2018は参加者が過去最多
となりました.筆者はレギュラー論文とデモ論文が採択されましたので,論文発表を
通じて海外から日本に来られた同領域研究者の皆様と議論させて頂きました.
以下,主として参加者の立場からICMR 2018の開催状況を報告します.


ICMR 2018の見所
----------------
ICMR 2018は基調講演を始め,企業講演,パネル討論,ワークショップ,口頭・ポスタ
ー・デモなどの発表形式を含む多彩なプログラムで構成され,すべての口頭発表はシン
グルセッションで行われることが一番の特徴です.このようなプログラムの編成において
参加者全員が質の高い口頭発表を聴講することができました.これにより大勢の参加
者が集まり,厳選したレギュラー論文の価値をより多くの聴講者に共有できたと考えら
れます.口頭発表に加え,全てのレギュラー論文はポスター発表を求められ,口頭発表
の補足として,著者らは参加者と議論をさらに深めることができました.

また,多くの国際会議と異なり,最優秀論文賞は査読結果に基づいて事前に選出された
4本の論文が「Best Paper Session」において最終的に審査されました.アワード審査
委員より口頭発表と論文の質を含めた総合評価で選出された最優秀論文は,当日のバン
ケットで結果発表とともに表彰されました.このようなオンサイトの最優秀論文審査は
発表者と聴講者にとって非常に良い刺激になったと思います.(DB分野の国際会議でも
このような審査方式を導入したら良いかもしれません)

さらに,もう1つ魅力的だと思った点は,ICMR 2018は,投稿カテゴリにおいて従来
のショート論文を無くし,レギュラー論文(ACMフォーマット,最大9ページ)のみに変更
したことです.Double-blindの査読を経て採択されたレギュラー論文は,Oral発表と
Poster発表に分かれて通知されます.要するに,採択論文は,発表形式が異なるもの
の,すべてレギュラー論文扱いとなります.従って,業績評価においてプラスになるた
め,学生諸君や研究者達にとって投稿の動機が向上すると考えられます.今年の採択率
はOral 15.4%,Poster 17.0%とかなり競争的でした.

プログラムにおけるほかの見所は,以下をご覧下さい.


ICMR 2018の概況
----------------
ICMR 2018の参加者は合計250名前後のうち,日本からの参加者は81名(約1/3)で1位,
中国からは53名で2位,その次は欧州諸国からの34名でした.人数は過去最多だったそ
うです.また,会場でお会いした先生方の中にIEEE Fellowの方も多くいらっしゃった
ことは私にとって印象的でした.裏を返せば,ICMRはマルチメディアに関する情報検索分
野でのトップ会議だと評価されたからこそ,当分野の重鎮が集まってくると考えられます.

また,今回のICMRにおける国別投稿件数のトップ3は,中国(58件), 米国(18件), 日本
(11件)で,国別採択件数のトップ3は,中国(21件), 米国(7件),日本(3件)でした.日
本開催ということもあり,国内からは投稿も採択も件数的に3位に入ることができまし
た.筆者からもレギュラー論文1件が採択され安堵しています.今後VLDB2020が日本で
開催される時には,日本からの投稿数と採択数がいずれもトップ3に入ることを期待し
つつ,自らも微力ながら貢献できるように頑張らなければならないと強く思っています.

さらに,発表された論文の研究トピックの傾向を確認してみると,映像や画像・音声な
どのデータに対して,深層学習技術を用いて内在する特徴の抽出,コンテンツやセマン
ティクスの解析と検索を行う内容が多くありました.従来のテキストデータと連携しつ
つ画像・映像・音声を横断したクロスメディアやマルチモダリティを取り入れた研究が
主流のように感じました.

最後に,パネル討論でパネリストに持ちかけられた議論のテーマ「Top-5 Problems in
Multimedia Retrieval」に関するディスカッションは興味深く,今後の研究方向性が示
されました.パネリストはICMRのSteering Committee Chairであるシンガポール国立大
のTat-Seng Chua教授,高次元類似検索では有名なNIIのMichael Houle教授,IEEEとACM
FellowであるUCIのRamesh Jain教授,ACM SIGMM Vice Chairも務めたAugsburg大の
Rainer Lienhart教授,およびTrento大のNicu Sebe教授から構成されました.登壇者の
先生方は,それぞれ独特な見解を述べられました.結果的に共通のTop-5問題を導き出
すことはできませんでしたが,ある程度今後の方向性は見えてきました.例えば,これ
からのマルチメディア向けのデータ解析は人が中心であり,human-in-the-loopは不可
欠であること,映像・画像データに潜在しているあらゆる物体間の関係性・インタラク
ションの分析,大規模なクロスメディアデータにおける高速な検索処理を支える次世代
索引技術などの共通点が言及されていました.マルチメディア分野での研究問題は,究
極的に「ナビゲーション」問題の1つに集約されると,Ramesh Jain教授は独自の見解を
披露されました.例えば,全ての問題は人に関わるのであれば,人は何をする,何処で
する,どうするというWHAT/WHERE/HOWにまとめられるそうです.


ICMR 2018の新しい試み
----------------------
ICMR 2018では,幾つかの新しい試みが導入されましたので,
以下に主な試みを挙げます.

(A) テクニカルプログラムの構成において,すべての口頭発表はシングルセッションで
行われたことと,最優秀論文賞の審査セッションおよびパネル討論を設けたこと.

(B) 投稿の仕組みについて,ショート論文のカテゴリを無くし,レギュラー論文のみに
絞ったことと,採択論文の発表形式をOralとPosterに分けること.

(C) マルチメディア分野の最高峰の国際会議ACM Multimedia 2018の TPC Workshopを
ICMR 2018のプログラムに設置したことと,ACM MultimediaのArea Chairによる招待講
演セッションを設けたこと.

詳細については,以下をご覧下さい.


NECからの貢献と研究発表
------------------------
最後に,筆者がICMR 2018において発表した論文の研究内容,ならびにNEC中央研究所か
らの貢献を簡単に紹介させて頂きます.

ICMR 2018では,筆者の所属研究チームからレギュラー論文とデモ論文による研究発表
を行いました.レギュラー論文では,提案技術の詳細を紹介し,デモ論文では,提案技
術を実装したうえで,結果を可視化するデモシステムを紹介しました.発表内容は,大
量の映像から人物の出現パターン(時間・場所など)を数値化し,うろうろしている人な
どの不審者を高精度で自動分類できる技術でした.不審者の見逃しを防ぐため,出現パ
ターンの違いに注目して不審者を抽出します.人物について映像に現れる出現頻度や,
動き,滞在時間等の項目を統計処理し,その変動の度合いを変化曲線で表します.さら
に統計項目に対して重み付けすることにより,特定の出現パターンの人物だけを抽出す
ることが可能となります.本技術を応用することで,特定対象を効率的に絞り込み,探
索することが可能となります.例えば,迷子,徘徊等の状況に応じて,早い段階での適
切な対応ができるようになります.詳細は,以下をご覧下さい.

筆者からの両発表には合計50名以上の参加者が訪れました.発表内容が分かりやすい,
実用性が高いなどのコメントが寄せられました.他にもNECからは,物体指紋技術に関
するデモ発表,および協賛会員としての企業講演と無人レジの展示もありました.今回
NECからの貢献は,ICMR今後の発展につながれば嬉しく思います.

また,筆者がICMR 2018のプログラム委員として,査読への貢献が組織委員会に認めら
れ,優秀査読者賞(Outstanding Reviewer Award)を受賞致しました.
本賞は,総勢111名委員の中から6名が選ばれて贈られたものです(受賞率5.4%).
過去の六年間には,筆者がDBとMMの両分野において,データベースのコアとなる索引
技術を活用して,マルチメディアにおける最も莫大なデータである防犯映像を対象とした
高速な映像検索技術の研究開発を進めてきました.ようやくMM分野でも評価され
つつあり,一人のDB研究者として信念を持って学際領域を開拓してきて良かったなと
思っています.MM分野から頂いた励ましを胸に,今後もDBとMM分野のギャップを埋め
られるように精一杯頑張って参ります.


むすび
---------
ICMR 2018は幕を閉じましたが,ICMR 2019の準備も始まりつつあります.次回は
2019年6月にカナダのオタワでの開催となります.日頃,画像や映像・音声などの
マルチメディアに触れている,もしくは,テキストとその他の媒体を横断した情報検索に
関わる研究をされているデータベース学会の皆様には,ぜひICMRへの投稿をチャレンジ
することをおすすめします.分野を横断して研究を行うことで,異分野での新しい
空気を吸うことができ,間違いなく新しい体験が得られると思います.
引き続きよろしくお願いします.

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

■4■  データシステム研究へのお誘い(BDI/xSIG/VLDB突破会) 
川島 英之(慶應大学)  

問合せ処理やトランザクション処理などのデータシステムを筆者は研究しています。

これは美しい設計原理と精妙巧緻な実装技芸から構成されるエキサイティングな分野です。

データシステムの研究スキーム構成には、その上位層にあるアプリケーションと、

下位層にあるハードウェアに関する知識が必要です。なぜならデータシステムは、

支援すべきアプリケーションを知らねば機能を決められませんし、立脚するハードウェアの

特性に合わせて設計しなければ性能と信頼性を損なうからです。


三分野の識者が集う場を求めて、2014年に筆者は鬼塚真先生(阪大)と油井誠さん

(トレジャーデータ社)にお願いし、草の根研究会 BDI (ビッグデータ基盤研究会)を

始めました。これまでに頂いたご講演は、並列データベースシステム、自動運転と大学

ベンチャー、天文学における超大規模データ処理、OSSコミュニティでの信頼獲得術、

匿名化処理の実例、トップ大学留学体験談、トップ会議に通すまでの苦労、性能

測定の実践と哲学、米国での戦い方、常識外の計算機アーキテクチャ、企業での

大規模クラスタ運営の実情、メモリの現在と未来、論文には書かれない実装の詳細、

機械学習を支える基盤、トップ会議報告などです。いつも質問が止まらず、

時間が足りないことが悩みです。これまでの開催履歴は下記の通りであり、

次回は8/7@慶大日吉キャンパスで開催です。

https://github.com/bdi-research/bdi_records


今日、データシステム分野で競争に勝ち抜くには、異分野のシステム研究者との連携

が有効です。例えば、トランザクションによるファイルシステム高性能化がSC/FASTで

報告されており、コンパイラ技術による問合せ最適化がVLDBで報告されています。

複数のシステム分野に関する研究者が一同に会して議論を行う場として、筆者が

PC副委員長を務めたxSIGがあります。xSIGではPCメンバが投稿論文を判定

会議で議論するため、フィードバックが丁寧になりますし、査読者に異分野研究者

が含まれるため、視野の広いコメントが提供されます。トップ会議への投稿準備に

xSIGをご利用頂けましたら幸いです。

http://xsig.hpcc.jp/2018/


データ系トップ会議採択を目指して切磋琢磨する場として、筆者もお手伝いさせて

頂いているVLDB突破会があります。この詳細は鬼塚先生の記事に譲ります。

http://dbsj.org/dbjapan/2017/msg00283.html


データシステムにご関心をお持ちの方は、BDI/xSIG/VLDB突破会にお越し頂けましたら幸いです。