日本データベース学会

dbjapanメーリングリストアーカイブ(2014年)

DBSJ Newsletter Vol.7, No.2 2013年度上林奨励賞を授賞して


┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2014年5月号 ( Vol. 7, No. 2 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

新緑の候,皆様にはますますご清栄のこととお喜び申し上げます.
本号では,2013年度上林奨励賞を授賞された3名の方にご寄稿を賜りました.
http://dbsj.org/info/2013_dbsj_award/
DEIMフォーラム2014における授賞式でも受賞の言葉がございましたが,記事とし
て改めて拝読すると,三者三様の人柄を感じる内容となっています。また、共通
するメッセージは『トップカンファレンスは不採録が基本、そこからどれだけ
前に進めるか』、まさに採録は自ら引き寄せるものという励ましの言葉です。


本号ならびにDBSJ Newsletterに対するご意見,あるいは次号以降に期待する
内容についてのご意見がございましたら,news-com [at] dbsj.org までお寄せく
ださい.

                             日本データベース学会 電子広報編集委員会

=======================================================================

----
目次
----
1. 上林奨励賞を受賞して〜ICDE 2010への論文採択に至る道のり〜
    油井 誠    独立行政法人 産業技術総合研究所

2. DBコミュニティに育てられ 〜上林奨励賞を受賞して〜
    前川 卓也  大阪大学大学院情報科学研究科

3. アカデミアからビジネスのデータベースの世界へ
    斉藤 太郎  Treasure Data, Inc.


-----------------------------------------------------------------------

■ 1 ■ 上林奨励賞を受賞して 〜ICDE 2010への論文採択に至る道のり〜
                                   油井 誠 (産業技術総合研究所 研究員)

平成25年度上林奨励賞を受賞することのきっかけとなりましたICDE 2010への論
文採択に至る道のりを紹介します.ICDE 2010に採択された論文では,データベー
ス管理システムのI/O処理で肝となるバッファ管理機構について,メニーコアプ
ロセッサを前提とした発想の転換を行った提案を行ったことが評価されました.
他方で,多くのトップカンファレンスに採択された論文がそうであるように,こ
の論文も一発で評価されたわけではありません.

論文を最初に国際会議に投稿したのは,私が博士後期課程3年目の学生のときで
ICDE 2009でした.このときの査読結果としては,Weak reject2つ,Accept1つで
不採択という結果でした.確信度高のレビュワーからは厳しい意見も浴びせられ
たのですが,一方で建設的な意見もくれ,このような評価をすればよいのではな
いか,というような有益なアドバイスも頂けました.トップカンファレンスへの
投稿経験はこの時が初めてであったのですが,このレベルでは自分が甘いと思っ
ているようなところは全て潰さないとレビュワーに指摘されるということを,身
を以て経験しました.

このときの論文は不足部分も多かったのですが,幸い,核心をついたレビューも
頂くことができました.実際に自分がレビュワーの立場になってみるとわかるこ
とですが,論文の本質的な部分の問題点を指摘するよりも評価実験の不足,関連
論文の抜け落ち等は容易に指摘しやすい部分です.同じ不採択のレビュー結果を
貰うにしても,このような落としやすい理由での不採択を頂くことは避ける努力
を行って,真に有益なコメントを引き出すことがトップカンファレンスへの採択
に重要だと思います. 

その後,博士論文の執筆や学位審査で暫くこの論文の改訂作業はできなかったの
ですが,学位を採ったあとは国際会議向けの論文執筆に集中し,ICDE 2009での
レビュー結果に加え,WebDB forum 2008のレビュワーからの指摘も反映して論文
をブラッシュアップさせていきました.

論文も早めに仕上がり,今回は余裕を持って投稿できると思っていたのですが,
思わぬ落とし穴もありました.ICDE 2010の論文投稿締切り直前のICDE 2009で競
合となるような手法が提案されて,ちょうど論文が出版されたのです.トップカ
ンファレンスは甘えが許されないということは前回身をもって感じました.そこ
で,投稿期限も迫っておりましたが,論文著者の方にコンタクトをとって実装詳
細を問合せながら競合手法を実装し,提案手法と比較評価していきました.こう
して自分で思い当たる論文の弱点を全て埋めていき,自分でも満足できる形で論
文をICDE 2010に投稿し,最終的に採択を得ることができました.

データ工学専門委員会ニュースレター第1号の喜連川先生のインタビューで上林
先生が若手にトップ国際会議を目指すことを奨励されたというエピソードが紹
介されているのを目にしました.
http://www.ieice.org/iss/de/old/newsletter/letter1.pdf
今回私が頂いた上林奨励賞もデータベースに関する研究や技術に対して国際的に
優れた貢献を行った若手会員を*奨励*するための賞だとされております.

現在の日本のデータベース学会を創られ盛り上げて来られました上林先生の名の
付いた賞を受賞したことに恥じぬように,また若手研究者としてデータベースコ
ミュニティを盛立てていけるように,継続的にトップレベルの国際会議に研究成
果を発信していくことを目標として頑張っていかなければならないと,今回の受
賞を得て改めて感じました.
     (油井 誠  独立行政法人 産業技術総合研究所 情報技術研究部門 研究員)


-----------------------------------------------------------------------
■ 2 ■ DBコミュニティに育てられ 〜上林奨励賞を受賞して〜
                                            前川卓也  (大阪大学 准教授)

このたびは平成25年度上林奨励賞という身に余る賞をくださいましたこと,改め
ましてご推薦頂いた方々をはじめ,日本データベース学会会員の皆様に感謝申し
上げます.

私は大阪大学の西尾研究室の出身でありまして,学生時代に日本データベース学
会が関係するDEWSや夏のDBワークショップにたびたび顔を出させていただいてお
りました.その際に,DBコミュニティの暖かさ,コミュニティ形成の大切さ,コ
ミュニティメンバーの研究に対する情熱や研究遂行のテクニックなどを感じ,学
ばせていただきました.私が今回の上林奨励賞にご推薦頂いた理由として,トッ
プ国際会議などの採録を挙げていただいておりましたが,そのような会議にある
程度論文を通せるようになった頃にはDBの分野を離れていたため,DBコミュニティ
に育てていただいたにも関わらず,そのノウハウなどを共有できずに居たままで
した.その上,上林奨励賞まで頂きまして,DBコミュニティの懐の深さに感服し
ております.

そこで大変恐縮ですが,今回の寄稿の目的が後進の研究者への刺激ということで,
若い方々に向けてそのノウハウ的なものに関して話させていただこうと思います.
しかし,偉大な先人の方々がそのテクニックに関してはこれまでに色々と語られ
ておりますので,今回はその心構えについて語らせていただきます.とは言え,
それも言葉で表すのはなかなか難しいのですが,一言で言うと「へこたれない」
くらいでしょうか.当初私が投稿をしていた会議はDB系ではなかったため,私の
周りに採録された人もおらず,どうやって論文を書いていいのかも良く分からな
い状況でした.ですので,当然リジェクトの嵐だったのですが,めげずに査読者
のコメントに応じて実装をやり直し,論文を書き直し,次の年の会議に投稿&新
しいネタを追加でもう1本投稿というのを繰り返していると,論文が通るように
なり,3,4本通るまで必死でやっていると,その後はそれほど苦労せずとも(実
際はそれなりにしてますが)通せるようになるのではと思います.その後は,トッ
プ会議などに通すことなど意識せずに好き勝手に研究をしていっても,作法が身
についているのでそれなりに論文が通るのではないかと思います.トップ会議に
通すために研究をやるのも馬鹿らしく,自身の知的好奇心から好き勝手に行った
研究がトップ会議に通ったというのが一番かと私は考えておりますが,そのため
にはある程度の苦行が必要です.

最後に,このような話をたくさんの人の目に触れるDBSJニュースレターに寄稿す
るのは死ぬ程恥ずかしい限りなのですが,私の屍を踏み台にDBコミュニティの若
い方々が活躍されることを願っております.
                      (前川卓也  大阪大学大学院情報科学研究科 准教授)


-----------------------------------------------------------------------
■ 3 ■ アカデミアからビジネスのデータベースの世界へ
                                        斉藤 太郎 (Treasure Data, Inc.)

不思議なもので,アカデミアの世界を飛び出し企業への転身が決まった後で,上
林奨励賞という栄誉ある賞をいただけることになりました.歴代の受賞者は大学
や企業の研究所で日本のデータベース業界を牽引しておられる方ばかりですが,
僕の今後は,データベースビジネスの現場に飛び込み,より多くの人にデータベー
スを使っていただけるよう尽力していくことになります.

東京大学においては,トランザクション処理,XMLデータベースなどを研究し,
その後,生物情報分野に移ってからは,ゲノムサイエンスの巨大データを扱う現
場でデータベース技術の応用を追求してきました.そして現在,日本人がシリコ
ンバレーで起業したTreasure Dataというクラウド上のデータベースサービスを
展開する企業で,ソフトウェアエンジニアとしてデータベースシステムの開発に
従事しています.

このように様々な分野を経験してきましたが,僕の中に一貫してあるのは「皆が
データベースを使えるようにする」というテーマです.今回の受賞理由となった
Relational-Style XML Query (SIGMOD2008で発表)は,SQLを用いて木構造データ
の検索を簡単にする研究ですが,これは生物情報の現場にあるデータを簡単に扱
えるようにしたいという観点から始まった研究でした.DEIM2014で紹介させて頂
いたSilkという分散システムの研究も,巨大なゲノム情報のデータ処理をいかに
簡潔にコーディングし,クラスタ上で計算できるようにするかを考えた研究です.

一方,僕が現在所属しているTreasure Dataでは,データを集める部分をfluentd
というオープンソースソフトウェアを提供して簡単にし,クラウドを用いたデー
タの管理や分散クエリを手軽に動かすためのサービスを提供しています.アカデ
ミア,企業と場所は違えど,データベースを使いやすくしたいという意味では,
Treasure Dataに移ることに大きな迷いはありませんでした.むしろやりたかっ
たことを現場で追及できる喜びの方が大きいです.

Treasure Dataには業界の動向を分析するマーケティングチームと,サービスを
現場のお客様に届けるセールス,サポートチームがあり,実は彼らが会社の中で
一番重要な役割を担っています.いくらエンジニアがよい製品を作ったとしても,
製品を業界内で適切に位置付けし,その魅力を正確に伝え,実際に使ってもらえ
るところまでサポートすることなしには,作ったデータベース製品に価値が生ま
れないからです.

同様のことが研究においても当てはまります.いくら良い研究をしたとしても,
読み手に届けるまでは研究の価値が生まれません.そのためには,研究を分野の
中で正確に位置づけ,読み手のバックグラウンドを考慮した言葉を使ってわかり
やすく論文を記述することが大切です.SIGMODに論文を通す際に最も気をつけた
ところは,実装の細部よりも,そのようなプレゼンテーションの部分でした.

データベース業界で最も注目が集まる場所はやはりSIGMODですが,そこへの日本
からの投稿数が一桁や〜十数本という現状は,日本の研究のプレゼンスのために
良いことではありません.これから研究者を目指す方にとって,SIGMODの査読は
大変厳しいのでめげてしまうこともあるでしょうが,普段論文を読むときから技
術だけではなく,わかりやすい英語表現も同時に吸収するようにして,論文を読
みやすく仕上げる糧としてください.そして,ぜひ一番注目を浴びる場所に論文
を投稿し続けて欲しいと思います.

また,データベースの技術を必要としているのは,データベース業界の研究者や
企業だけではないこともぜひ知ってください.RDBMSなどの既存のデータベース
の技術ですら,導入・運用の面で現場にフィットした製品がなかったり,データ
ベースの知識が不足しているために十分に活用できていない事例が多くあります.
ゲノムサイエンスのような分野でも,TB〜PB級のデータ処理を手軽にまかなうた
めに新しい種類のデータベースが必要とされています.今後はそのような各分野
にある潜在的なニーズに応えるため,データベースを扱える研究者・企業の役割
がますます重要になってくるでしょう.研究としても,現場のニーズに裏打ちさ
れたテーマというのは読む人を引きつけるものです.

歴史を紐解いてみても,データベース研究の発展は企業との関わりなしには語れ
ません.リレーショナルデータベースの台頭は企業の製品化に後押しされたもの
ですし,トランザクション処理で重要なARIES(Wright-ahead logging)の技術が
90年代のIBMの窮地を救ったという話がありますが,これも製品化されてこそ価
値が生まれたものです.そしてGoogleのMapReduceを活用したクラウドにおける
データ処理の技術など,データベースの分野は,企業がデータベースの研究・技
術をビジネスに活用してきたことで発展してきました.

このたび,アカデミアを離れることにはなりましたが,幸いにもその企業の立場
でデータベースの分野に今まで以上に深く関われることになりました.今後は,
Treasure Dataがデータベース分野の発展の一翼を担う存在となれるよう,その
成長を支えていきたいと思います.
                        (2014年4月20日 斉藤 太郎 Treasure Data, Inc.)