日本データベース学会

dbjapanメーリングリストアーカイブ(2016年)

[dbjapan] DBSJ Newsletter Vol. 9, No. 2 : WWW2016, ICDE2016, SDB2016, Newsletterアンケート調査まとめ


┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2016年6月号 ( Vol. 9, No. 2 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

清々しい新緑の季節もあっという間に過ぎ、半袖シャツで通勤・通学されている
方も多いかと存じます。例年にも増して気温の変化が激しい日々が続きますが、
体調には十分に気をつけてお過ごし下さい。

本号では、4月に開催されたWWW関連で最大の国際会議WWW2016に参加されたYating Zhang
さんと川前徳章さんに寄稿頂きました。同じ会議を学生の視点と企業研究者の視点
から語っており、読み応えのある記事になっています。また、ACM SIGMOD 日本支部
の支援を受けてICDE2016に参加された欅 惇志先生のご寄稿も、現在計画中の技
術動向講演会、勉強会の予告編として興味深い内容となっています。
今年度から産総研に勤務されている山口祐人さんには、データマイニングに特化
した国際会議SDM2016の参加報告をご寄稿頂きました。日本からの参加者はまだ
まだ少ないとのことです。
最後に、本年2月に実施した「DBSJ Newsletterアンケート調査」のまとめ記事も
掲載しています。会員の皆さまの興味分野が拡がっている様子が伺え、こちらも
興味深い内容となっています。

本号ならびに DBSJ Newsletter に対するご意見あるいは次号以降に期待する内容について
のご意見がございましたら news-com [at] dbsj.org までお寄せください。


                                 日本データベース学会 電子広報編集委員会

============================================================

----
目次
----

1.WWW2016参加報告
        Yating Zhang  京都大学

2.WWW2016参加報告
        川前徳章  NTTコムウェア/東京大学

3.ICDE 2016 に参加して 
        欅 惇志  東京工業大学

4. SDM2016参加 & 発表報告
        山口祐人  産業技術総合研究所

5.DBSJ Newsletterアンケート調査まとめ 
        DBSJ電子広報編集委員会


------------------------------------------------------------------------
■■■1.WWW2016参加報告             (京都大学  Yating Zhang)

2016年4月11日〜15日にカナダのモントリオールで開催された、Webに関する代表
的な国際会議であるInternational World Wide Web Conference (WWW)に参加し
ました。Research TrackのFull Paper採択数は115/727(15.8%)、Poster Paper
は72/156(46.1%)でした。日本からの採択数はTutorial1件、Full Paper3件、
Poster Paper7件、Demo1件で、トータルとしては昨年よりも増加しています。

メインプログラムは11分野で構成され、昨年のWeb Infrastructureがなくなり、
あらたにWeb Scienceに置きかわりました。わたしたちの論文 “Detecting
Evolution of Concepts based on Cause-Effect Relationships in Online
Reviews” もこの分野で採択されました。この論文では、Amazon review
archives などのオンラインレビューを使い、たとえば、mp3の登場によって人々
は音楽を聴きながらジョギングするようになったといった、技術の進歩が人々の
社会的行動に与える影響を発見する問題に取り組んでいます。Web Science では
このように、社会的行動やプロトコルがどのようにWebに反映されているかその
影響を分析したり、逆にWebから新しい社会的パターンを発見したりすることに
注目が寄せられていました。Computational Social Science for the World
Wide Webというチュートリアルもこれに関連するトピックを扱っています。この
チュートリアルはコンピュータサイエンスと社会学両方の研究者によって行われ
ており、computational social science の重要性を伝えるとともに、Webから人
々の社会的行動を分析するためのフレームワークの紹介などがなされていました。

Research Track では、ソーシャルネットワーク、行動分析やパーソナライゼイ
ションといったトピックが依然として多く、セマンティックウェブやビッグデー
タ、セキュリティとプライバシーに関する研究も増えていました。キーノートセッ
ションでは World Wide Web の発案者である Tim Berners-Lee と Cisco
Systems の主任エンジニアである Mary Ellen Zurko がWebセキュリティの緊急
性と課題について述べ、Google のリサーチディレクターである Peter Norvig 
はセマンティックWebにおけるデータの曖昧性、不完全性、信頼性といった課題
を提起していました。

会場となったモントリオールはあちこちでアートが見られる芸術的な都市で、会
場の近くにも多くの美術館や映画館がありました。なかでもモントリオール・ノー
トルダム聖堂は別格で、ただそこに座って目を閉じ、パイプオルガンの音色に耳
をかたむけるだけでも十分な価値があります。

次回のWWWはオーストラリアのパースで開催予定です。
ぜひ参加をご検討ください。

( Yating Zhang  京都大学大学院情報学研究科 社会情報学専攻 博士後期課程)

------------------------------------------------------------------------
■■■ 2.WWW2016参加報告        (川前 徳章  NTTコムウェア/東京大学)

World Wide Web Conference (WWW) 2016 はWEBの標準化団体W3Cが主催する国際
会議で、今年で25回目の開催となります。2016年の4月11日(月)から15日(金)
の日程でカナダのモントリオールで開催されました。この時期日本ではまだ桜が
咲いていましたが、現地は氷点下になる日もありました。開催数日前まで雪が降っ
ていたそうです。

今年の投稿状況ですが、世界56ヶ国から727件の投稿があり115件が採録(採択率
約16%)されました。昨年は929件中131件(採択率約14%)なので採録率が上昇
しています。今年の内訳を見てみると、米国からは420件の投稿があり採録は74
件、日本からは41件の投稿があり3本が採録となっています。投稿および採録状
況は、他のWeb/データベース/データマイニング/機械学習/人工知能に関する国
際会議と似た状況です。Web系に関する国際会議ということで、会議で扱うテー
マはソーシャルネットワーク/コンテンツ分析/WEBマイニング/クラウドソーシン
グからセキュリティそしてモバイルまで多岐に渡ります。テーマが近い他の国際
会議と比較すると、テーマあるいはアウトプットが面白く、新規性がある研究が
重視され、研究のための研究はあまり見当たりません。その研究成果の発表前に
論文の査読プロセスがあり、ここでは研究の完成度は勿論、論文の完成度が重視
されます。具体的には、既存研究の調査が十分であり、課題の設定、研究の位置
付けやモチベーションが論文で明確になっていること、検証や評価実験の妥当性
と結果が重視されます。
そのような検証は、大抵の場合、大規模データあるいは充実した計算環境が必要
になります。従って、そういった条件が揃った企業が研究はもちろん、採録にも
有利で、その結果が採録状況に反映されていると感じました。論文の査読者とし
て必ずしもその道の専門家がアサインされているとは限らないので、専門家以外
から「中立」以下の評価を付けられないような論文構成、用語選択や文書表現も
必要になると思います。

会議初日はWorkshopやTutorialがあり、二日目から例年通り、World Wide
Web(WWW) の産みの親の一人である Sir Tim Berners-Lee 氏の Keynote から始
まり、Research track が続きます。Research track は並列で5トラックありま
すので、事前にプログラムとセッションの会場を確認しておくと、効率的に回れ
ます。会場の至るところにあるモニタでは、Twitterで流れているWWW2016のハッ
シュタグのタイムラインを表示しているため、人気のセッションとその反響をリ
アルタイムで知ることが出来ました。余談になりますが、WWWは日本では別の意
味でよく使われています。そのため、ハッシュタグでなくWWW2016で検索すると、
別の意味で使っているツーイトが大量にひっかかり、この会議に関係する情報が
埋没して見つけ難くかったです。Keynoteは他にも Peter Norvig 氏(Director
of Research, Google)、Mary Ellen Zurko 氏 (Principal Engineer, Cisco
Systems)、Baroness Martha-Lane Fox 氏(Chancellor of the Open
University)の計四名でした。いずれのkeynoteも盛況でしたが、中でも、WEB 
コンテンツの意味理解に関するGoogleの取り組みを紹介された Peter Norvig 氏
の講演は参加者の関心を強く惹き、質問者が行列を作り、休憩時間になっても質
問されている氏の姿を目にしました。Sir Tim Berners-Lee 氏はKeynoteでWebの
分散化、及びユーザが自身のデータを所有することの重要性、決済機能の簡素化
に向けた標準化と開発、IoTに向けた展望について、この会議のマスコット的存
在であるトナカイのぬいぐるみと講演し、会場を沸かせました。氏はランチだけ
でなくバンケットでも精力的に歩き回り、ボランティアの学生を中心に話しかけ
たり、サインに応じたりしていました。

Webサービスだけでなく技術も栄枯盛衰があり、Research track のトラック名や
その数にも変化があります。WWW看板Research track?でもあった Semantic Web
はSemantics & Webと名称が変わり、他にも3 件のResearch trackで名称変更が
ありました。一番勢いがあったと思われる Research track は Social Networks
& Graph Analysis で、比較的広い会場が割り当てられており、聴講者も集めて
いました。他にはキーノートと同様にセキュリティ/コンテンツの意味解析への
関心が高く、トラック数がそれぞれ4トラックあり、こちらも人気でした。会議
で扱うテーマが同じACM系の Knowledge Discovery and Data Mining (KDD)や
Web Search and Data Mining (WSDM)と被ることもあり、そちらで御馴染みの
参加者や論文著者も見かけました。私は自身の発表及び研究と関係のあるコンテ
ンツ解析/自然言語処理/グラフ解析を中心に聴講しました。KDD やWSDMでは機械
学習や人工知能の新技術の発表が多いですが、WWWではそれら技術を使って何
(主にWebサービス)が出来たか、あるいは解決したといった応用面の発表が多
いと感じました。最近、Google, Facebook などWeb関連企業による機械学習のツー
ル類のオープン化が続いていますが、発表論文でも評価実験に使ったプログラム
のコード公開が目立ちました。

世界最先端の研究者およびそのマネージャがこれだけ集まる機会はそうそうない
ので、情報収集と発表の場として参加を検討してみては如何でしょうか?論文そ
のものはネットから得られますが、参加することで自身のアイデアに対するフィー
ドバックや人脈、そして研究へのモチベーションが得られます。来年はオースト
ラリアのパースで4月3日(月)から7日(金)に開催の予定です。お花見の予定
も気になると思いますが、時差ぼけに苦しまなくて済みそうなので、是非とも投
稿、参加を検討されてはいかがでしょうか?

  (川前 徳章  NTTコムウェア/東京大学 客員研究員)
  
------------------------------------------------------------------------
■■■ 3.ICDE 2016 に参加して       (欅 惇志  東京工業大学) 

2016年5月16日から20日までフィンランドのヘルシンキで開催された 32nd IEEE
International Conference on Data Engineering (ICDE 2016) に参加して参り
ました.今年の ICDE は例年よりもひと月程度遅い時期の開催であり,例年通り
の時期にはヘルシンキがまだ寒すぎるというのが理由なのではないか話を伺いま
したが,確かに,日中は少し肌寒い程度であったものの,朝晩はそれなりに冷え
ましたので,例年通りの時期の開催だと辛かったかもしれません.

成田空港からヘルシンキ・ヴァンター空港までは直行便で約 10 時間のフライト,
その後ヘルシンキ・ヴァンター空港からヘルシンキ市内 (ヘルシンキ中央駅) ま
ではバス,タクシー,鉄道 (Ring Rail Line) のいずれの手段でも約 30 分程度
の移動です.ヘルシンキ中央駅からカンファレンス会場であるアールト大学ビジ
ネス学部 (Aalto University's School of Business) の校舎までは,ヘルシン
キ市内を縦横無尽に走り回っているメトロに乗っても,徒歩でも,15 分程度で
す.事前に Web 上で登録しておけば,ヘルシンキ市内の各所の無人レンタルサ
イクルである City bikes も利用可能です. 

Research Paper の投稿数は 400 件で,そのうちの 99 件が採択されました (採
択率 25%).投稿数と採択率ともに去年と同程度のようです.投稿された論文の
トピックは,データマイニング・知識獲得・可視化関連の論文の件数が急上昇し
た他は,概ね昨年と同様の傾向であり,ソーシャル・ネットワークのグラフ処理,
時空間データに関する論文がかなり目立ち,これらの 3 トピックだけで全論文
のうちの半分を占めていました.その一方で,クエリ処理・最適化・索引関連の
論文の投稿数が去年よりも下がり (ただし,クエリ処理・最適化・索引として分
類されてもよい論文が時空間データとして数えられている論文がありそうには感
じます),その他のトピックについては去年の投稿数と同等か,微減少となりま
した.採択論文のトピックについても上記と同様の傾向であり,トピックごとの
採択率は大きくは変わらなかったようです.全体的な傾向として,アルゴリズム
系の論文が大部分を占めており,システム系やハードウェア系などの低レイヤの
研究は (去年と同様に) あまり多くないように感じました.

採択論文の国別や地域別の割合では,最も多くの論文が採択されているのはアメ
リカ合衆国であったものの,地域別ではアジア太平洋地域が全体の半数以上を占
めていました.やはり中国,オーストラリアの採択論文の割合が多かったものの,
シンガポールと韓国からも,ヨーロッパ諸国よりも多くの論文が採択されていま
した.また,これらアジア諸国からの論文の著者リストを見ていると,欧米の著
名な大学や大企業との共著論文がかなり目立ったので,今後日本からも多くの論
文をトップカンファレンスに通すためには,ノウハウの蓄積や共有を含めて戦略
的に研究を進める必要性を感じました.

また,私の専門はデータベースコアというよりは情報検索ですが,アイデアは面
白いけど情報検索系の会議ではなかなか通らなさそうな,"主流ではないアプロー
チ" による研究が発表されていたり,情報検索分野や自然言語処理分野で開発さ
れた技術をデータ工学の観点で高速化した研究もあったり,ユニークな研究を知
ることができて,大変貴重な経験になりました.

なお,今回の ICDE 2016 への参加は,ACM SIGMOD 日本支部の多大なるサポート
により実現しており,7 月下旬頃開催予定の支部大会において,より詳細な各種
統計量や,キーノート,パネルなどを中心に,一部の研究発表を紹介させて頂く
予定です.現地でお会いした喜連川先生が「このトークは是非日本の若手研究者
に聞いてもらいたい」と仰っていた,TCDE CSEE Award Presentation の内容に
ついても紹介させて頂きます.是非ともご参加をご検討ください.

・ACM SIGMOD 日本支部
http://www.sigmodj.org/

また,個別の研究発表論文については,6/25(土) に ICDE2016 & WWW2016 勉強
会がございますので,興味のある方は是非ご参加ください.聴講のみも可能となっ
ております.

・ICDE2016 & WWW2016 勉強会
http://www.kde.cs.tsukuba.ac.jp/dbreading/?ICDE2016%26WWW2016%CA%D9%B6%AF%B2%F1

・dbreading 勉強会概要 (メーリングリスト登録や発表資料作成方法)
http://www.kde.cs.tsukuba.ac.jp/dbreading/

最後になりますが,この度はこのような貴重な経験をさせて頂き,この場をお借
りして ACM SIGMOD 日本支部に心より感謝申し上げます.

(欅惇志  東京工業大学 情報理工学院 情報工学コース 助教)

------------------------------------------------------------------------
■■■ 4.SDM2016参加 & 発表報告       (産業技術総合研究所 山口祐人)

2016年5月5日から7日にかけて開催された SIAM International Conference on
Data Mining(SDM2016)に参加し、論文発表を行いました。SDM はデータマイニ
ング分野の主要国際会議の一つです。トップ会議である KDD に次いで、毎年多
くの良い論文が発表されます。今回はアメリカ・マイアミで開催されました。残
念ながらマイアミ・ビーチではありませんでしたが、気候もよく、過ごしやすい
環境で研究の議論をすることができました。

今回は Ricardo Baeza-Yates や Pedro Domingos を含む著名な研究者による招
待講演が4件、一般発表が96件、チュートリアルが6件、併設ワークショップが3
件ありました。一般発表では、データマイニング分野の会議らしく、「新しいデー
タを持ってきて、もしくは新しい問題を定義して、それをうまくモデル化して解
く」という研究が多く見られました。私は主にグラフデータを扱う研究の発表を
聞いていましたが、既存の問題(ノードの分類やクラスタリングなど)を解く際
に、いままでその問題を解く際には使われていなかった新たな特徴(エッジの符
号、ノードの属性、ノードの役割など)を取り入れるという研究が多くありまし
た。SIAM系会議ということもあり、モデルやその解き方が理論的にきれいだとい
う印象も受けました。

私の発表はグラフ上のノードの属性を推定するというノード分類問題に関するも
のでした。ノード分類問題では、多くの場合隣接ノードからの手がかりを元に属
性を推定しますが、従来手法は手がかりの量を考慮しませんでした。それに対し
て今回提案した手法では、隣接ノードからの手がかりが多いほどより推定結果は
確信度が高いとし、それを確信度の高い手がかりとしてさらに隣接ノードへ伝播
させていきます。これにより、従来手法より精度の高い推定を実現しました。発
表についていろいろな質問を頂きましたが、特に Springer の編集者の方が興味
を持ち、事前にメールでアポを取ってまで話をしに来てくださったのは印象的で
した。

参加者数などの統計情報の公式な発表はありませんでしたが、聞くところによる
と300人弱とのことでした。国別の参加者数は感覚的にはアジア系と欧米系で半
分ずつといったところでした。投稿数は371件で、採択率は25.9%でした。日本か
らの発表は4件と少なく、参加者も主著者の方以外はいらっしゃらないようでし
た。

2017年の SDM はアメリカ・ヒューストンで開催されるようです。SDM は KDD な
どとくらべて規模はあまり大きくありませんが、その分他の研究者の方々と密な
議論ができるのではないかと思います。興味を持たれた方は来年の SDM への投
稿・参加をご検討されてみてはいかがでしょうか。

(  山口祐人  産業技術総合研究所  人工知能研究センター 研究員 )

------------------------------------------------------------------------
■■■ 5.DBSJ Newsletterアンケート調査まとめ 
                                           (DBSJ電子広報編集委員会)

DBSJ Newsletterの定期発行が3周年を迎えることを期に、読者アンケートを行い
ました。回答の依頼を、DBSJ Newsletter 2月号(2月1日発行)および、dbjapan
メーリングリスト(2月13日)の2回行い、実施期間は約一ヶ月間(2月1日〜3月1
日)でした。

総回答数は27件でした。ご協力いただきました皆様、大変ありがとうございまし
た。以下で、いくつかの調査結果をご報告いたします。

・アンケートの回答者の属性

「年齢」
20代  :15%
30代  :22%
40代  :33%
50代  :19%
60代  : 7%
70代以上: 4%

「所属」
企業   :37%
教育機関等:52%
博士学生 : 4%
リタイア : 4%
未回答  : 4%

今回の調査のお願いをdbjapan経由で行ったため、半数以上の回答者は毎号DBSJ
Newsletterを読んでおられる方でした。年代は30〜40代を中心としながらばらけ
ていました。学生からの回答はあまり得られませんでした。

・現在読まれている記事

現在、DBSJ Newsletterでは、国際会議参加報告、学会等開催報告、海外研究生
活についての記事を数多く掲載しています。それらについて、どの程度読まれて
いるかの調査を行いました。得られた回答において、「ほとんど読む」を2点、
「よく読む」を1点、「あまり読まない」以下を0点としたときの加重平均をスコ
アとしたとき、以下のようになりました。

国際会議参加報告  :1.38
学会等開催報告   :1.12
海外研究生活について:1.08

これら三種の記事については、すべて70%以上の回答者が「ほとんど読む」また
は「よく読む」と回答しているという結果が得られました。自由回答においても、
SIGMOD/VLDB/ICDEなどの国際会議参加報告に興味を持っているという回答が得ら
れました。

・今後望まれる記事

今後、どのような記事が望まれているかについての調査を行いました。得られた
回答において、「非常に読みたい」を2点、「読みたい」を1点、「あまり読みた
くない」以下を0点としたときの加重平均をスコアとしたとき、以下のようにな
りました。

国際会議参加報告      :1.48
新しい技術・コンセプトの紹介:1.44
学会等開催報告       :1.33
書籍や論文のレビュー    :1.30
事例、既存技術、標準等の解説:1.07
研究の進め方、論文の書き方 :1.07
海外研究生活について    :1.04
企業からの技術紹介     :1.00
読者の声          :0.52

現在、記事として掲載されていないもののうち、新しい技術・コンセプトの紹介、
書籍や論文のレビューなどが望まれていることが示されています。自由回答では、
論文の投稿先を決めるために有益な記事や、受賞者のメッセージやインタビュー
を読みたいという意見が得られました。

・興味がある研究分野

回答者が興味を持っている研究分野についての調査も行いました。「データベー
ス」「データ処理」「データマイニング」「Web」「情報検索・情報推薦」「機
械学習・人工知能」という分野において、回答者の半数以上の方が興味を持って
いると回答しました。

・まとめ

以上、概要ではありますが、アンケート調査の結果をご報告いたしました。この
結果を踏まえて、DBSJ Newsletterをより良くするよう努力していきたいと思い
ます。今後とも、よろしくお願いいたします。

------------------------------------------------------------------------