dbjapanメーリングリストアーカイブ(2020年)
[dbjapan] DBSJ Newsletter Vol. 13, No. 5: ICML2020, KDD2020, VLDB2020参加報告, VLDB2020開催報告
- To: "'dbjapan [at] dbsj.org'" <dbjapan [at] dbsj.org>
- Subject: [dbjapan] DBSJ Newsletter Vol. 13, No. 5: ICML2020, KDD2020, VLDB2020参加報告, VLDB2020開催報告
- From: "maruhashi.koji [at] fujitsu.com" <maruhashi.koji [at] fujitsu.com>
- Date: Wed, 30 Sep 2020 23:58:08 +0000
- Accept-language: ja-JP, en-US
- Arc-authentication-results: i=1; mx.microsoft.com 1; spf=pass smtp.mailfrom=fujitsu.com; dmarc=pass action=none header.from=fujitsu.com; dkim=pass header.d=fujitsu.com; arc=none
- Arc-message-signature: i=1; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com; s=arcselector9901; h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-SenderADCheck; bh=JUMzg17vOjDC6vEAL8O4+kMXq3PVNN7SnutkOhItE+s=; b=cUtPxv83Jk2CNtH2YmwRWHaHV4cKsSqiU50LMd9pbOQ42UvxAW1eGVW4TYi2Qed1M+9ilKe8hdTc3JUhFZvset8hnleD/sW4XVDDAdeCRVJVLcSh9J1CQ1ZMpkP3K1Yz9rvu9yfB6V6PvWIwFqchMBCnUGLGnNxUfMfP/2xInZnWUppzLVgi95YrpgwLBJmBEjSG4jcip5wfs6YF4DZrI4d9mKSTz0lFMdmHaj+MLNB9z+3SWCM+KPoTM7DUHa8g6YFCCvHEdQueYsbXTesyvohFYlrzy9V+5gMOmRFzy9oRAFBBwsZAdOyDAk4AJY9dPRYZUdB99eCEhuZrcvhRkQ==
- Arc-seal: i=1; a=rsa-sha256; s=arcselector9901; d=microsoft.com; cv=none; b=YnXcusrEMZoQ7dvjcqGLHH5QWGVkUI37GvE+d49OxXqXEyLMzagcv4OUwb+8o0UJIcv6ESRFyf6GcETyRFbiLODsO1VXYUgZWAt9BVJTzeulF+Uj4JH4+OnGa/jPeqW1F+uF+wr1HqpDZKp8r9D9syBBXeF35cix9c7HQiwmVtmbwqrK9FHVz58hUHTpctRINMfJbkZBhst7tSMUb8pYtT26VLY8KiJs9Ll7bugMYmnHvvvBLOXnPPP2gUqKIYxFpahIqIXVTzlMlW5BhRG1tYlU7GBHo2jj5ffkKraGRWDCffRjM+SBagf/vmIiKX5Zhte2POSANGpO/dNOM6IETQ==
- Ironport-sdr: 5mub+EKcauFvgcZOMAK9odXyRXXHKtZTiaFn+LIFfQKd7l1WM+fvbSkJeRUGsf4a+X41K/Vi5C vzycGvtk2uDbzlfekrgI7jG+WSXiJAh8bKAa+Ebe8pM/1N5x3xKWDUIX2mGOVzZV/LC3u8i2L+ 1rUJd2F21wX3+kLe2KkRv/WrbVDvfxV7hmZQgjtAUZACqAABBDvP/T21Csj3bSRAH/GTwN5El2 9hi9ccRb1/PWxO4nBMTplg0Jb7JMeK/3P7LkFVyAs6BMorhRt4K6CohNDFZSXq9dQEJfVI3qJf dIk=
- Thread-topic: DBSJ Newsletter Vol. 13, No. 5: ICML2020, KDD2020, VLDB2020参加報告, VLDB2020開催報告
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ ┃ 日本データベース学会 Newsletter ┃ 2020年10月号 ( Vol. 13, No. 5 ) ┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 本号では7月から9月までに開催されましたICML, KDD, VLDBの参加報告, ならびにVLDBの開催報告記事をご寄稿いただきました.特に元々東京開催予定 だったVLDBの開催報告につきましては,オンライン開催のための技術的な支援と ウェブ関係の取り組みも併せ,3件のご寄稿を頂きました. 本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する内容 についてのご意見がございましたらnews-com [at] dbsj.orgまでお寄せください. 日本データベース学会 電子広報委員会 (担当編集委員 丸橋 弘治) ======================================================================== ---- 目次 ---- 1.ICML2020
参加報告 加藤 圭造(株式会社富士通研究所) 2.KDD2020
参加報告 中嶋 一貴(東京工業大学) 3.VLDB2020
参加報告 小出 智士(株式会社豊田中央研究所) 4.VLDB2020
開催報告 石川 佳治 (名古屋大学) 5.VLDB2020
の舞台裏 宮崎 純 (東京工業大学) 6.VLDB2020 Webページ奮闘記 横山 昌平 (東京都立大学) ======================================================================== ■ 1 ■ ICML2020
参加報告 加藤 圭造(株式会社富士通研究所) 【会議概要】 2020年7月12日から7月18日にかけてオンライン開催されたThe
Thirty-seventh International Conference on Machine Learning (ICML2020)
に参加しました.本会議はNeurIPSと並 んで (近年では,ICLRも比肩されることがあります)
機械学習分野のトップ会議であ り,機械学習の基礎から応用まで幅広い研究が発表されます.今年度は投稿数4,990件, 採択数1,088件,採択率21.8%でした.オンライン開催で会場のキャパシティによる発 表制限が無くなるため,採択率が例年より高くなるのではとの予測もありましたが, 実際には昨年度の22.6%よりも更に低い採択率となりました.近年,AI分野の会議の論 文投稿数が過熱しておりますがICMLも例外ではなく,昨年度の3424件に対し45%も増加 しています.国別の採択数を見ると,1位は米国の728件(66.9%) ,2位は英国の123 件(11.3%)
,3位が中国の122件(11.2%)でした.この傾向は機械学習技術が重要と なるコンピュータビジョン (CV)
分野でのトップ会議CVPR2020における国別の採択率 が1位は中国の39.2%,2位は米国の22.7%,3位は不特定の6.2%であったのと大きく異な ります.近年AI分野での躍進が目覚ましい中国ですが,基礎理論よりも実応用に注力 している事の現れかと思います.日本からの採択は31件 (2.8%)
であり多いとは言え ない状況ですが,東京大学/理研の杉山先生が著者別採択数では単独首位の11件と存在 感を見せる場面もありました. 【研究のトレンド】 ICMLでの発表は多岐に渡り,Graph Neural Network,Explainable AIなど様々なトレ ンドがあることを感じましたが,本報告では自然言語処理 (NLP)
,CVなど周辺分野を 含めて特にホットなトピックであると感じた教師無し学習/生成モデルに注目したいと 思います.機械学習の実用において,教師データの用意にかかるコストが課題となり ます.教師データを用いない教師無し学習により,データの生成規則を学習する生成 モデルはその対策として注目されています.チュートリアルセッションでも” Representation Learning Without Labels”と教師無し学習に関するセッションが開催されました.ま た,Outstanding Paper Honorable Mentionにも”Generative Pretraining From Pixels”と生成モデルに関する論文が選出されました.この論文では画像において, 入力された画素系列から次にどのような画素が生成されるかを自己回帰的に予測する Image GPTを提唱しています. Image GPTによる学習の利点は,単に予測が出来る様に なるというだけでなく,ダウンストリームタスクに有効な特徴量の事前学習が可能で あることです.Image-GPTの事前学習で獲得された特徴量は,CIFAR10の画像分類タス クにおいて教師ラベル有りのImageNetを用いて事前学習したResNet152の性能を上回る など目を見張る効果を発揮しました.GPTは元々自然言語処理 (NLP)
の分野で脚光を 浴びたモデルであり,入力された単語系列から次にどのような単語が生成されるかを 予測します.NLP分野でもBERT,XLNetといった自己回帰モデルの学習により獲得した 特徴量は文書分類,含意関係認識等様々なNLPタスクで有効な事が知られています.大 規模データによる事前学習は引き続き注目したいトピックです. 私が本会議で発表した”Rate-Distortion Optimization Guided Autoencoder for Isometric Embedding in Euclidean Latent Space”も生成モデルに関するものです.先述のGPT はデータの生成過程の確率モデルを明示的に持たないのに対し,VAEの様に確率モデル を学習する手法があります.データの生成確率が分かれば,正常データの確率分布と の違いから異常データを検出するなど,様々なアプリケーションに用いる事が可能で す.しかし,VAEやGANといった従来の生成モデルでは,特徴量空間における確率分布 と実際のデータ空間での確率分布の関係が十分に考慮されておらず,学習した特徴量 空間での変数が実際のデータに与える影響の定量的な解釈や正確な確率分布の推定が 困難という課題がありました.私たちはこの課題を解決するべく,データを特徴空間 に等長的 (元の空間の距離や確率分布が変換後の空間でも保たれる)
に変換可能な生 成モデルを新たに開発しました.映像圧縮等に用いられる情報通信理論,特にRate-distortion (RD) 理論において,理想的な圧縮の際にはデータの変換が等長的変換と等価である正 規直交変換になることに着想し,RD最適となるように設計した誤差関数のもと深層生 成モデルを学習することで,学習後のモデルの変換が等長的となることを数学的に証 明しました.効果として,通信アクセスデータなどの異常検知のベンチマークで,従 来の深層生成モデルの誤り率と比較し世界最高精度を達成しました.先述の大規模デ ータの教師無し学習で獲得した特徴量により種々のタスクの性能が向上している一方 で,その特徴がデータにとってどの様な意味を持つのかの解明は十分ではありません. 実用においては,特徴の解釈も重要な課題の一つになると思われます. 【オンライン開催について】 今年度はCOVID-19の影響を受け多くの会議がオンライン開催となっています.ICML 2020ではポスターセッションの代わりに事前収録したビデオを配信し,質疑応答は発 表毎にアサインされた特定の時間にZoomによるビデオチャットで行われました.発表 を並ばずに好きな時間に聞けるという利点がある一方,時差の問題や会場ならではの 熱気を感じる事が出来ない,ネットワーキングが難しいなどの不利な点も感じました. 次回以降の開催ではオンライン,オフライン融合型の双方の利点を享受できる様な形 式を期待します. (加藤 圭造 株式会社富士通研究所) ----------------------------------------------------------------------- ■ 2 ■ KDD2020
参加報告 中嶋 一貴(東京工業大学) 2020年8月23日から27日まで開催された,KDD2020 (26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining)
に参加してきました.KDDは, データマイニング・データサイエンス分野のトップ会議です.本来はサンディエゴで 開催される予定でしたが,コロナウイルスの影響でオンライン開催となりました.今 年は68ヵ国から3950名の参加登録があったとのことで,KDDへの注目の高さがうかがえ ます. KDDの論文は,Research trackとApplied Data Science trackの2つに分かれます.前 者は一般的な研究論文で,後者はビジネス・産業における実務に重点を置いた論文で す.Research trackには過去最多の1279件の投稿があり,そのうち217件が採択されま した.トピックは,(流行り寄りではあるものの)
基礎理論から流行りのものまで幅広 く取り扱っていました.Applied Data Science trackでは,761件の投稿のうち121件 が採択されました. 本会議では,Research trackのグラフ・ネットワークに関する発表を中心に聴講しま した.いくつかの発表を聴講して,「一般的な仮定で確立されてきた理論保証付きの ネットワーク解析手法をより実用的なシナリオで機能できるようにする」という目的 が研究コミュニティ内に共有されていると感じました.従来の一般的な仮定とは,エ ッジに向きや重みが無い・グラフは静的・ノードやエッジは1つの種類しかない (=グ ラフが均質)
などが挙げられます.KDD2020では,特に「Heterogeneous network (非 均質なグラフ)」「Hypergraph (エッジに任意の個数のノードを含むグラフ)」「Temporal network (動的なグラフ)」に対する理論的解析手法の研究が目立ちました. また,他者の様々な発表を聞いてKDDの特色を感じ取りました.KDDは(1)
結果のイン パクトの大きさ,(2)
結果の再現性,(3) オリジナリティの3つを主に論文に求めてい るように思います.採択論文の発表は,分野を深く知らない自分が見てもわかりやす くインパクトの大きいものばかりでした.また,論文の著者は,本文に加えて最大2ペ ージまで,結果の再現性を補強する資料を書くことが推奨されています.結果の再現 性の補強とは,例えば,緻密な理論的分析,実験で使用したデータ・ソースコードの 公開,実験手順の詳細な記述などが該当します.査読において「再現性」という評価 項目があったことからも,結果の再現性が重視されていることがうかがえます.そし て3つ目のオリジナリティは,他の関連するトップ会議と比較して高く評価されている 印象を受けました.理論的分析はまだ詰めきれていないけれど独創性・新規性で圧倒 するような論文もいくつかあり,「アイディアの面白さ・ユニークさを大事にする」 というKDDの理念が伝わってきました. 私は「Estimating Properties of Social Networks via Random Walk considering Private Nodes」というタイトルで発表を行いました.研究の目的は,友人を非公開とするプラ イベートノード (例: Twitterの鍵アカウント)
が存在するソーシャルグラフの統計量 をランダムウォークベースで高精度に推定できるようにすることです.従来の研究で は,プライベートノードに起因する推定値のバイアスは修正できないものとして無視 されてきました.本研究では,「ソーシャルグラフ上に一様独立にプライベートノー ドが存在する」という仮定を導入することで,プライベートノードによる推定値のバ イアスをほぼ完全に修正できることを理論的かつ実験的に示しました.発表後に「あ なたの論文を読んだよ!」と連絡をくれた方がいて,とても嬉しかったです. 本会議の終わりには,ネットワーク科学分野 (特にネットワーク上の感染伝搬)
で著 名なAlessandro Vespignani先生によるKeynote「Computational Epidemiology at the time of COVID-19」がありました.ご自身のこれまでの研究成果と紐づけながら,コ ロナウイルスに関するcomputationalな感染予測アプローチを紹介するという内容でし た.Google Flu Trendsによるインフルエンザ予測が上手くいかなった教訓から,ビッ グデータだけでなくモデル・シミュレーションによる感染予測が重要である,とのこ とでした.特に印象的だった言葉は「詳細な感染伝搬過程のモデルが常に良い予測を するわけではない」ということです.数多くの感染伝搬モデルを試行されてきたであ ろうVespignani先生の主張にはかなりの説得力がありました.この講演を通じて,感 染伝搬に関する数理的なモデルやシミュレータの研究成果には長年の膨大な蓄積があ るのだと認識することができました. また,ビッグデータ基盤研究会 (9/14,
オンライン開催) においても,KDD2020の参加 報告をさせていただきました.発表のスライドを以下のURLに公開してありますので, ご興味のある方は是非ご覧ください. https://kazuibasou.github.io/slides/bdi_KDD2020.pdf 次回のKDD2021は2021年8月にシンガポールで開催されます.現地によるオフラインと 遠隔によるオンラインの同時開催だそうです.興味を持たれた方はぜひ投稿・参加を ご検討ください. (中嶋 一貴 東京工業大学) ----------------------------------------------------------------------- ■ 3 ■ VLDB2020
参加報告 小出 智士(株式会社豊田中央研究所) VLDB 2020 (第46回)
は8月31日から9月4日まで開催されました.本来は東京で開催予 定でしたが,新型コロナウィルスの影響でオンライン会議として開催され,私も自宅 から「在宅国際会議」に参加しました.発表によると,採択率は全体で25.0% (207/827) でした. 私自身,VLDBに初参加であり,また自分自身の論文が採択されたこともあり,今回の VLDBを非常に楽しみにしていた一人でした.一方で (オンラインDEIMの参加経験はあ ったものの)
オンライン国際会議は初めてということもあり,差し支えなく発表でき るだろうか,という不安もありました.実際には,時差を解消する形で各発表が2度行 われる,というタイムテーブルを採用しており「なるほど」と膝を打ちました (ウェ ブサイトのナビゲーションやデザインは素晴らしく,複雑なスケジュールにも関わら ず快適に参加できました).また "Virtual Tokyo"
のセッションの動画を視聴し「東 京で開催されていたらどんな感じだったのだろう」ということに思いを馳せることも できました. セッションでの各講演は Youtube
の録画を視聴し,その後ライブQAという形式でした. 通常の国際会議ですと重複したセッションはどちらかを聞き逃すことになりますが, 今回の形式ではいつでもビデオの視聴が可能であったため,気になる発表を聞き逃す ことがなく,その点はオフラインの会議にはない利点だと感じました.一方で,研究 者同士の立ち話や挨拶,知り合いを増やす,という機会は (すくなくとも私の場合は) あまりなく,この点ではオフラインの国際会議に一日の長がある,と再確認しました (この点はおそらくすべての国際会議で共通の課題だと思います). キーノートとしては以下の3講演が行われました.(1) Dan Olteanu
先生による関係デ ータとして定義されるデータ上での機械学習に関する講演,(2) Julia Stoyanovich
先生による "Responsible Data Management"
に関する講演,(3) 喜連川先生による Out-of-Order Database Execution (クエリ実行における並列化パラダイム)
に関する 講演.また,Ruha Benjamin
先生による人種差別とテクノロジーに関する特別セッシ ョンも開催されました.アルゴリズムから社会問題まで広い話題の講演を興味深く拝 聴しました. 私自身は空間データベースのセッションで "Fast Subtrajectory Similarity Search in Road Networks under Weighted Edit Distance Constraints"
という題目で発表し ました.これはネットワーク上の移動軌跡DBに対する類似度検索の方法を提案した論 文になります.EDR
や ERP といった有名な軌跡の類似度関数を含むような「重み付き 編集距離」と呼ばれるクラスの類似度関数に対して,広く適用可能かつ高速検索が可 能なアルゴリズムを提案したことが貢献になります. 全体を通しては,機械学習 (ML)
に関連した話題がトレンドである,と感じました. 一言にDB+MLと言っても,DBチューニング,索引構造,クエリ最適化など幅広いトピッ クに対するMLの適用事例を知ることができ,大変勉強になりました.個人的に特に興 味深かったのはFerraginaらによる "PGM-index: a fully-dynamic compressed learned index with provable worst-case bounds"
でした.これはB+木などのソート配列をML ベースの近似回帰曲線に置き換えるものですが,計算量などに関する理論的保証を有 し,(この分野は素人ですが)
面白い方向性のように感じました. 最後になりますが,コロナ禍での VLDB 2020
のスタッフの皆様の苦労は大変なもので あったと推察します.その中で素晴らしい会議を開催していただいたことに,一参加 者としてお礼申し上げます. (小出 智士 株式会社豊田中央研究所) ----------------------------------------------------------------------- ■ 4 ■ VLDB2020
開催報告 石川 佳治(名古屋大学) VLDB 2020にご参加いただいた方,ご協力いただいた方,また,ご支援いただいたスポ ンサーの皆様,誠にありがとうございました.直接のお礼ができず申し訳ございませ ん. VLDB 2020の参加登録者数は,会議終了の時点で4,723人となりました.SIGMODやICDE が3,000人で打ち止めだったとのことですので,参加者数だけで見るとDB分野で史上最 大の会議となりました.なお,今回のresearch paper
の数は207件で,過去最多であ ったVLDB 2015(ハワイ)の160件の1.3倍となりました.東京にそれだけ人気があった ということでしょう. VLDBを日本で,という話が出てきたのは2015年4月のことでした.当初は2019年に開催 という案もあったのですが,オリンピックの前年で,都内のホテルの多くが改修中と のため,いっそ2020年に,ということになりました.パラリンピックの時期ならば開 催できないというリスクはないと考えていましたが,まさかこんな事態になるとは思 ってもみませんでした. オンライン会議ということが決まったのが今年の4月に入ってからで,それからオンラ イン会議の設計の議論をはじめ,また,スポンサー規定の見直しを行うなど,それま で進めていた話を大幅にリセットすることになりました.それからは状況に流される ばかりでしたが,何とか無事に開催することができました.特に,共同実行委員長の Christian S. Jensen先生,プログラム委員長のMagdalena Balazinska,Xiaofang Zhou 両先生には,24時間の会議という,これまでにない運営方式のアイデアの提案と,実 現のために多大な貢献をいただきました.結果的に,この方々とチームが組めて本当 に良かったと思っています. オンライン会議になったことで,急遽Oliver Kennedy,宮崎純両先生に共同技術委員 長として参加していただきましたが,お二人の知識とご努力で,オンライン開催の技 術的な部分が具体化・実装できました.加えて,Web担当の横山昌平先生には本当にお 世話になりました.オンライン会議になってすべての仕事がぎりぎりの後ろ倒しにな り,最後はリアルタイムの作業でしたが,Webサイトの設計と実装が素晴らしく,スム ーズな運営ができました.また,大塚真吾先生に作っていただいたVirtual Japanの動 画は大好評でした.この他,多数の方々にお世話になりましたが,全員には言及でき ず申し訳ありません. オンライン会議になったことで,日本の関係者や学生に会議運営や参加で加わってい ただき,海外研究者との交流や,若手・学生のコミュニティ参加を促すという,そも そもの目的が達成できなかったことはたいへん残念です.また,VLDB 2020を機会とし て日本の企業とのいろいろな連携を図ることも考えていましたが,実現には至らず, これも心残りです. 一方で成果としては,困難な状況でまずは何とかオンライン会議をやり遂げることが できたということです.著者の発表の機会を確保することは最低限の目標でした.ま た,24時間のプログラムにより,世界中で誰もが発表を聞くことができるというオン ライン会議が実際に実現できました.これについては,日本時間での会議開催では不 都合な人が多いという現実の問題に対応するための苦肉の策でしたが,新たな会議モ デルの提案になったかもしれません. VLDB 2020が東京に決まって以来,海外で会った多くの研究者から,日本に行くことを 楽しみにしているという言葉をもらいました.冗談でしょうが,「来年はSIGMODに論 文を出すなと家族から言われている」と言った人もいました.今回の東京での会議が 幻になったことで,今後さらに日本での会議開催を求める声が出てくるかと思ってい ます.次こそは良い形で日本での国際会議の開催ができるとよいと思います. (石川 佳治 名古屋大学・VLDB 2020共同実行委員長) ----------------------------------------------------------------------- ■ 5 ■ VLDB2020
の舞台裏 宮崎 純(東京工業大学) VLDB2020もオンラインとなりましたが,タイムゾーンを気にすること無く参加できる, 恐らく世界初の24時間開催の国際会議となりました.それを実現するため,6月下旬に VLDB2020運営委員会のコア会議に技術担当としてニューヨーク州立大学バッファロー 校のKennedy先生とともに急遽招集され,Web担当の東京都立大学の横山先生も加わり, 雰囲気の良いチームで様々な課題を解決していくことになりました.横山先生とはVLDB から遡ること半年前,3月上旬に開催されたDEIM2020でも一緒に運営に携わり,オンラ イン会議のいろいろな経験を積んでいたことが,VLDBでも大いに役立ちました. 今回のVLDBでの目玉である24時間開催を実現する上で重要となったのは,単一障害点 (single point of failure)を極力なくすこと,すなわち冗長化することでした.その ために,本会議では各セッションの座長は2名ずつ配置することとし,技術的にはクラ ウドベースのサービスを用いているため単一障害点はありません.発表動画の再生や 様々なオンラインツールの維持管理を委託した会議サポート会社も,今回のVLDBのた めにネットワークを2本引いて冗長化対応をしていました. 2名の座長のうち,時差を間違えて1名しか座長がいなかったセッションがいくつかあ ったものの,会議は最後まで順調に進むと思われました.しかし,5日目の9月4日日本 時間午前7時過ぎから会議サポート会社の冗長化されたネットワークが2本とも不調と なる障害が発生し,その会社からセッションのコントロールや発表動画が配信できな い状況となりました.2時間後の午前9時からは喜連川先生による基調講演のリピート セッションが控えており,急遽PC Co-Chairのワシントン大学のBalazinska先生が中心 となって基調講演の開始延期を検討しつつ,技術的な対応策の検討が始まり,多くの メールが飛び交いました.その間にGeneral Co-Chairの名古屋大学の石川先生が喜連 川先生に連絡され,喜連川先生がライブで基調講演を行って下さることとなり,プロ グラム通り実施することになりました.トラブル対応が一段落して基調講演に入った ところ,座長のBalazinska先生が,大きなトラブルに動揺せず,全く何事も無かった かのように平然と司会をされていたことが印象に残りました. 今回のVLDBの経験を通して,問題の発生を無くすための技術的な対策だけでなく,万 一問題が発生したときにそれを即座に解決するチームワーク,信頼関係,そして人間 力の大切さを改めて認識しました. (宮崎 純 東京工業大学) ----------------------------------------------------------------------- ■ 6 ■ VLDB2020 Webページ奮闘記 横山 昌平(東京都立大学) 私のVLDBでのお役目は,会議のWebページを作るというものでした.国際会議・研究会 のWebページといえば,基本的には,CFPを載せるところから始まり,最終的には会議 前にプログラムを掲載すればオシマイという作業になります.ところが,今回,この コロナ騒動で会議期間中も(そして会議が終わっても),色々と忙殺される事になりま した.VLDBのWebページのデザインについては,以前書きましたので,ここでは,会議 の裏で,どのような事が行われていたのかを紹介しようと思います. 幸いな事に,VLDBの幹事団は私を含めて何人かはDEIMでの経験がありましたので,オ ンライン会議を成功させる秘訣が,オンライン会議のURLをどうやって適切に参加者に 伝えるかという部分だという事は分かっていました.その経験から,最初に提案した のが,セッションIDのラベリングスキームの刷新でした.従来,全てのセッションに は通番が振られていました,その為,例えばセッション1とセッション4はパラレルで 同時開催だが,セッション8はセッション1の次の時間帯に開催されるという,セッシ ョンIDから時間帯を類推するのが困難なラベリングスキームとなっていました.さら に加えて,「Demo Group A」とか「Tutorial 1」や「Kyenote 2」等があり,データベ ースのトップカンファレンスであるにもかかわらず,構造的とは言い難いラベリング スキームでした.今回のオンライン化で,数百の動画や会議のURLを間違い無くセッシ ョンに割り当てていく必要があり,もし例年通りのラベリングスキームだったらと考 えると,恐ろしくなります. このメールを読む皆さんはDEIMに参加されている方も多いと思いますが,DEIMでのラ ベリングスキームは時間帯を示す数字と,部屋を示すアルファベットを組み合わせて, 「1A」「2B」というようなIDを振っています.少なくとも,こちらのラベリングスキ ームの方が高機能ではないでしょうか.そこで,まず最初にVLDBのセッションのラベ リングスキームを,DEIMフォーマットへ変更しました.この事自体は非常に些細で地 味な変更ですが,今考えると,これが今回の成功に繋がった重要な判断だったと思っ ています. https://vldb2020.org/program.html プログラムを見ていただくとわかるのですが,本会議は01から60まで60個の時間帯が あり,パラレル方向に研究セッションはAからF,デモセッションはaからe,チュート リアルがT,プレナリーセッションがP,ソーシャルイベントがQやスポンサーセッショ ンがSとs等となっています.そのため例えば「46P」ならば時間帯46に開催されるプレ ナリーセッションだという事が一目で分かります.これは,実際には参加者には殆ど 関係ないのですが,膨大な数のURLを適切なセッション割り振るための主キーとして非 常に重要な役割を果たしました. 具体的には,このラベリングスキームのおかけで,URLをWebに掲載するワークフロー を自動化する事が可能になりました.URLは技術チームと会議をサポートする企業から 提供されます.生成されたURLはOneDrive上のエクセルファイルで統一的に管理されて います.このエクセルファイルを,Microsoft PowerAutomateを用いて自動的にJSONに 変換し,Webサーバにアップロードします.以下の三つのファイルがそのJSONファイル です. https://tokyo.vldb2020.org/VLDB2020timeslot.json https://tokyo.vldb2020.org/VLDB2020session.json https://tokyo.vldb2020.org/VLDB2020paper.json これを読み込んで,_javascript_で動的にあのカラフルなプログラムを作り出していま す.さて,このJSONを見ると,肝心のZoom等のURLが書かれていない事に気づくと思い ます.それが,オンライン会議開催において,最も重要な点です.もし,ここにZoom やYouTubeのURLを書いて,プログラムからZoomやYouTubeへ直接リンクしてしまうと, 誰でも匿名で参加可能となってしまいます.今回は参加無料の開かれた会議ですので, 身元確認までは必要ないと思いますが,会議を運営する以上は,管理責任上,完全匿 名ではなく,参加者名やメールアドレスぐらいは登録してもらう必要があります.そ こで,ZoomやYouTubeのURLはPrivate URLとして秘匿し,各Private URLに対応する, 公開可能なPublic URLを生成しました. 例えば41Pセッションで開催された喜連川先生のキーノートのYouTubeのPublic URLは https://tokyo.vldb2020.org/?tg=paper&go=video&id=pid!41P-1 です.これに接続すると,Sign-upしているユーザならば,YouTubeの喜連川先生のご 講演にリダイレクトされます.YouTubeのURLはこのtokyo.vldb2020.orgサーバの非公 開領域にこれもJSONファイルとして保持しており,これを参照します.Sign-upしてい ない場合は,名前やメールアドレスの登録が促され,入力後に喜連川先生のご講演に リダイレクトされます.これは,ユーザ認証としては殆ど意味ない仕組みですが,参 加者リストの管理と統計情報の取得に役立っています. VLDB2020は先に開催されたSIGMOD2020のやり方を踏襲しつつも,アメリカローカル開 催の色が濃かったSIGMODと異なり,全世界から参加ができるような工夫がされていま す.その最大の特徴は24時間ぶっ続け開催でしょう.一日を4つのブロックに分け,ア ジア,ヨーロッパ,アメリカから,最低2ブロックは参加しやすい時間に配置していま す.また各発表は二回,異なるブロックで行われるため,全世界のどこからでも,現 実的な時間帯に全ての発表が聴講できるように配慮されています.全世界からの参加 が前提となるので,タイムゾーンの変換が必要になりますが,タイムテーブルかあま りに複雑なので,いっその事という事で,変換テーブルを24時間の円で表現してみた のですが,いかがでしたでしょうか.(ちなみに,これ,ずーっと見ていると,くるく る回りますので,入眠効果があると思います.) https://vldb2020.org/program_timetable.html ただ,やはり,この円形の時差変換表を使っても,聞きたいセッションが何時何分か ら始まるのかを直観的に把握するのは,非常に困難です.そこで,プログラムにはロ ーカルタイムを表示する事としました.皆さん,プログラムに掲載された時間が日本 標準時(UTC+9)だった事に気づかれたと思います.これは『日本開催だから』ではなく 『皆さんのコンピュータが日本のタイムゾーンに設定してあったから』です.例えば, フランスから閲覧した場合はUTC+2となりますし,アフガニスタンからも10名弱の参加 がありましたが,その皆さんのブラウザにはUTC+4:30のローカルタイムでプログラム が記載されていたはずです.これがローカルタイムだという事に気づかずに,セッシ ョンの時間を逃した方もいたようですが,ぜひポストコロナにおけるオンライン国際 会議の『ニューノーマル』になって欲しいと思います. さて,長々と書いてしまいましたが,Webだけでなく,見えるところ,見えないところ で様々な工夫が行われた国際会議でした.新しいアイデアが湧くように出てくる幹事 団と一緒にVLDB2020に関われた事はとても幸運だったと思います.ただ,もういちど これが出来るか?と言われると,体力的に自信がないような・・・.会議が終了し, 燃え尽き症候群になりかかっていますが,来年三月のDEIM2021の準備も始まります. こちらもコロナの流行状況をみながら,以前とは色々と形が変わっていく事と思いま すが,ご支援・ご期待ください. (横山 昌平 東京都立大学) --- 丸橋弘治 株式会社富士通研究所 maruhashi.koji [at] jp.fujitsu.com |
- Prev by Date: [dbjapan] 今日、3時55分から喜連川が講演します。JSTのシンポジウムです。お時間のある方はどうぞ 喜連川
- Next by Date: [dbjapan] 【講演募集】人工知能学会 第114回人工知能基本問題研究会(SIG-FPAI) 開催:11/20・申込期限:10/9
- Index(es):