日本データベース学会

dbjapanメーリングリストアーカイブ(2016年)

[dbjapan] DBSJ Newsletter Vol. 9, No. 4: インターンシップ体験記, SIGIR 2017に向けて


┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2016年10月号 ( Vol. 9, No. 4 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

10月になりいよいよ秋本番を迎えました.季候も徐々に良くなり,スポーツ,読
書,行楽にと何をするにも快適な季節になりました.

さて本号では今までになかった新規の取り組みとして学生の皆様に今年の夏に行
われたインターンシップの体験記についてご寄稿頂きました.データベース分野
の研究に関わる方々にお願いしましたが,パナソニック,NEC,富士通など日本を
代表する企業におけるインターンシップについてご寄稿頂きました.来年以降イ
ンターンシップに参加することを考えている学生の方のご参考になればと思いま
す.

また前回の Newsletter から開始した SIGIR 2017 に向けた連載記事についても
ご寄稿頂きました.今回は7回分の連載のうち2回目の記事になります.今回の記
事では SIGIR における論文執筆における Tips をご紹介頂きます.なお連載記事
は以下の通りです.

1. 2016年 8月号 ACM SIGIR Conferenceとは? (加藤誠 京都大学)
2. 2016年10月号 SIGIR 2017 論文執筆 Tips  (上保秀夫 筑波大学)
3. 2016年12月号 企業スポンサー募集案内   (加藤恒昭 東京大学)
4. 2017年 2月号 DEIM でのイベント告知 (Workshop 投稿告知)
                      (大島裕明 京都大学)
5. 2017年 4月号 SIGIR 2017 ボランティア募集 (欅惇志 東京工業大学)
6. 2017年 6月号 SIGIR 2017 参加募集     (村上晴美 大阪市立大学)
7. 2017年 8月号 SIGIR 2017 アナウンスメント (高久雅生 筑波大学,
                     江草由佳 国立教育政策研究所)

本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する内容に
ついてのご意見がございましたら news-com [at] dbsj.org までお寄せください.

                                日本データベース学会 電子広報編集委員会

=======================================================================

----
目次
----

1. 新しい刺激を受けて
    高田 祥平 大阪大学

2. 異なる研究テーマに触れて
    竹岡 邦紘 関西学院大学

3. 自分の知らない知識に出会って
    渡 佑也 東京工業大学

4. SIGIR 2017 論文執筆ヒント集
    上保 秀夫 筑波大学

---------------------------------------------------------------------

■1■ 新しい刺激を受けて 高田 祥平 (大阪大学)

私はパナソニックのインターンシップに参加させていただきました.大学では
自然言語処理の研究をしているのですが,インターンシップでは Deep Learning
を用いた人工知能の開発に取り組みました.インターンシップに応募したの
はメーカー企業でのインターンに参加させていただくことで,大学の研究室で
行う研究ではなかなか考えることが難しいお客様を相手にした研究開発という
ものに肌で触れたいと思ったからです.

インターンシップに参加した思ったことは,現在行っている大学での研究とは
異なり,「どれだけお客様に役立つものか」「どれだけ会社の利益につながる
のか」という視点が必要であるということです.自分で行った研究が直接もの
づくりにかかわってくるメーカー企業の視点での研究開発が行えたことが新鮮
でした.また Deep Learning は今の大学における研究では触れておらず,授業
等で基礎知識だけを持っていた状態だったのですが,今回の実習では実際に
フレームワークを使って Deep Learning の実装を行うことができ,興味深く
取り組むことができました.

しかし普段扱わない Deep Learning についての開発には新たに多くの知識が
必要であったことや,時間が制限された中で研究をしなければならない点が
学生生活とは異なり大変でした.特に Deep Learning は大量のデータを扱い,
その学習に要する時間も長いので,就業時間内に処理を終わらせるにはいつま
でに実行させればよいか,またその処理の待ち時間で何ができるのかというこ
とをしっかり計画しながら実習を進めていくことに苦労しました.

インターンシップで特に印象的だったのが社員のみなさんがインターン生を
温かく迎え入れてくださったことです.普段の昼食も積極的に話しかけてく
ださり,こちらの緊張を和らげてくださるような気づかいをとても感じまし
た.飲み会でも学生同士ではできないような話をたくさんすることができと
ても興味深かったです.また他のインターン生との交流も忘れられない思い
出となりました.実習のテーマは異なりますが,全国各地から集まったイン
ターン生はみんな個性的でしっかりとした視点も持っており,とても刺激を
受けました.短い期間でしたが最終日には別れが本当に惜しいと思えるほど
かけがえのない仲間ができたことがこのインターンで最も印象に残っていま
す.

インターンシップにより研究での視点が自分のなかで大きく変わったと思い
ます.特に顧客の人にとって自分の研究がどれほど役に立つか,それをどう
やってアピールするかを考えて研究する経験を得られたことで,これからの
自分の研究を進めていく上で「世の中にとってどれだけ有用なものであるか」
という評価にも着目できるのではないかと思います.また今回のインターン
シップを通じて,実際の職場の雰囲気を感じ,社員さんの実際の仕事や生活
を見ることができたので,今後の就職活動においてとても参考になると思い
ます.社員さんとの縦のつながり,他のインターン生との横のつながり,今
の研究に対する新しい視点など,たくさんのものを得られるインターンは絶
対に行った方がいいと思います.

(高田 祥平 大阪大学大学院 情報科学研究科 マルチメディア工学専攻 鬼塚
 研究室)

---------------------------------------------------------------------

■2■ 異なる研究テーマに触れて 竹岡 邦紘 (関西学院大学)

私は日本電気株式会社(NEC) データサイエンス研究所のインターンシップに参
加しました.テーブルの要素だけが与えられたときに列やテーブルの名前を推
定する研究に取り組みました.

私がインターシップ先に応募したのは人工知能学会の全国大会で口頭発表した
際,座長を務められていたのがNECの方だったことがきっかけです.そこで声
をかけていただきNECのデータサイエンスに対する取り組みを知りました.また
NECデータサイエンス研究所で取り組まれている研究に興味を持ち,自分に今
まで足りなかった視点が得られると感じ応募しました.

プロジェクトで楽しかったことは自分の専門である機械学習以外の知識も吸収
することができたこと,プロジェクトに関して想定通りの結果を出せたこと,
他のインターン生とも研究についての議論ができたことの3点です.インターン
シップを通して,普段研究室にいるだけでは得られない他分野の知識や視点を
知ることができました.またその視点で課題を見ることで複数の解決手段が見
出せることもわかりました.社員の方々や他のインターン生と関連研究の見つ
け方やプロジェクトの進め方,研究のことについて会話することも楽しかった
です.特に自分とは異なるバックグラウンドの方が多かったので,とても刺激
を受けました.

一方,PCなどの機器の設定の違いと生活リズムについては大変だと思いました.
サーバやプロキシの設定など環境が異なるため,それに十分慣れるために数日
使ってしまいました.また毎日9時から17時半まで7.5時間の勤務をすることが
大変でした.普段,研究室では昼ごろから研究を始めていたので,生活リズム
を合わせることからはじめました.他の点では研究室に非常に近い環境だった
と思います.

特に印象の残っているのは他の社員の方に成果物を見せて説明したことです.
実際に自分が取り組んだ成果物を評価してもらえたこと,さらにコメントをい
ただいて改善点が見つかったことがとても貴重な体験でした.またメンターの
社員の方が海外出張されている間,日報を送ったことも印象に残っています.
文面だけで自分の状況を理解してもらうために日報を何度か推敲しながら書き
ました.そのおかげで一日の目標を言語化してから研究に取り組むようになり
ました.

インターンシップを通してスケジュールの作成能力と自然言語処理とデータ
ベースに関する知識は成長したように感じます.インターンシップ期間が短
かったため,週単位で目標を立てて研究を進めました.そのため,はじめに取
り組むべき問題の切り分けを行うなどの工夫をしました.また自然言語処理や
データベースは私の専門ではないので,十分な知識を持っていませんでした.
このインターンシップを通して,最低限の知識は身についたと思います.成長
をここで止めず,今後の研究活動に活用したいと思います.

私の場合,インターンシップでは大学での研究と異なるテーマに取り組みまし
た.そのため自分の知識の幅を広げることができたと思います.また異なる環
境で1ヶ月以上研究したことがなかったので,とても貴重な経験になりました.

(竹岡 邦紘 関西学院大学 理工学部 人間システム工学科 岡留研究室)

---------------------------------------------------------------------

■3■ 自分の知らない知識に出会って 渡 佑也 (東京工業大学)

富士通研究所のインターンシップに参加し PostgreSQL から MongoDB 上のデー
タベースへアクセスする拡張機能のプロトタイプ実装を行いました.富士通研
究所のインターンシップは指導教員からの紹介だったのですが,富士通研究所
のこれまでの研究やインターンシップのテーマなどを調べていくうちに,楽し
そうで是非取り組んでみたいと感じたので応募しました.富士通研究所が他の
会社より良いと思ったのはインターンシップであっても製品化も視野に入れた
実際の企業のプロジェクトに時間をかけて関われる点です.

毎朝,私が所属していたチームの方とのミーティングがあったのですが,そこ
で自分の進捗状況を報告したりメンバーの方からアドバイスをいただいたりし
ていました.開発作業自体はほとんど一人で行っていたので,試行錯誤してみ
たものの上手くいかないところがあり,行き詰まることがよくありました.そ
うしたときもミーティングで多くの意見をいただいて議論できたときは,「自
分がチームに所属している」ということを実感でき刺激的で楽しく思いました.

一方プロジェクトに必要な知識の習得に大変苦労しました.実装に当たっては,
PostgreSQL の内部処理について詳しく把握しておく必要があるのですが,私は
そうしたものに触れたことがこれまでほとんどありませんでした.メンターの
方に資料をいただいたり PostgreSQL のソースコードを読んだりしてなんとか乗
り切ることができましたがかなり苦労しました.

インターンシップでは特に研究所全体がとても自由な雰囲気だったことが強く
印象に残っています.自分が研究に打ち込みやすい環境作りをしている方もい
ましたし,何より上司・部下関係なく積極的にコミュニケーションをとれるよ
うな場所でした.

インターンシップの前後で知識量は明らかに増えたと思います.これまでにも
研究などで使ってきたツールについてはより理解が深まりましたし,逆に全く
扱ったことのなかったものにも触れることができ,視野が広まったと思ってい
ます.大学での研究ではインターンシップを通して身につけた知識・経験を
もとに,新たなアプローチから問題に取り組めるようになるのではないかと
思っています.また,インターンシップ先でいろいろな方と接するなか,これ
まで自分の研究分野という狭い世界でしか進路を考えていなかったところを,
それにとらわれずに未知の分野にも興味を持つようになりました.

インターンシップは純粋に楽しめるものだと思います.それでいて様々な成長
の機会ともなるので,積極的に取り組んだ方がいいと感じました.

(渡 佑也 東京工業大学 情報理工学院 情報工学系 宮崎研究室)

---------------------------------------------------------------------

■4■ SIGIR 2017 論文執筆ヒント集 上保 秀夫 (筑波大学 准教授)

初めて,あるいは,久しぶりにSIGIRに挑戦する方を対象に,論文執筆の参考に
なるヒント集をお送りします.出典は,ピーター・ベイリー氏(マイクロソフ
ト)が2013年にツイッターに投稿したものです.
原文と試訳は,http://togetter.com/li/993441 を参照してください.

1. タイトルは中身を表す.誤解させない,誇張しない,無駄に言葉遊びをし
   ない,Less is more,140文字は長過ぎる.
2. アブストラクトは論文をまとめる.短めの1段落に,主題,動機,目的,
   手法,そして成果を述べよ.相手に読ませたいと思わせること.
3. 序論.研究は何をしようとしているのか.どうしてそれが興味深く,新しい
   のか.読者は論文を読む次の1時間で学ぶことがあるか.最大1/2から3/4ペ
   ージ.
4. 関連研究.30-40論文の引用が好ましい.それより少ないとその主題に通じ
   ていない印象を与える.他研究者による代表的な論文を忘れないこと
5. 実験結果の報告では適切な統計情報を掲載すること.誤差範囲,信頼区間,
   効果量など.
6. 機械学習は目的に対する手段であり,それ自体が主食ではない.素性エン
   ジニアリングは,ユーザ行動に関する示唆が得られる場合などにおいては
   重要である.
7. 精度と簡潔さのためにギリシャ文字,数式,統計量を使うこと.ただしそ
   れらが意図していることを言葉でも表現すること.読者がそれらに精通し
   ていると仮定してはならない.
8. スペースに余裕がある場合は,引用参照番号の前に著者名を書くこと
   ([1] -> Doe [1]).そうすれば引用文献リストを行ったり来たりせずに
   済む.
9. 引用文献の参照.提出する直前に,LaTeXやWordの相互参照のアップデート
   を忘れずに.引用文献の著者名を確認すること.査読者になるかもしれな
   い!
10. テストコレクション(コーパス,クエリ,適合性情報で構成される評価用
    データセット)を使って評価をしているなら,複数のコレクションを使い
    なさい.2000年より前のコレクションのみを使わないこと.Ad Hocばかり
    がIRじゃない.
11. 大規模なログデータを分析したからといって研究が興味深くなる訳ではな
    い.分析から得られる知見が大切.特に一般化できる知見が.
12. 実動するIRシステムの構築には妥協がつきものである.開発したアルゴリ
    ズムの効果を拡大して未検証の側面まで主張しないこと.
13. 興味深い製品が興味深い研究とは限らない.逆も然り.両者を兼ね備えた
    内容が出版できるとも限らない.
14. 図.タイトルや軸ラベルを,紙面に印刷しても読める大きさにすること.
    色情報が解釈に必須ならば,図脚注に明記すること.
15. 分析対象から除いたデータがある場合は,何故どのように除いたかを記述
    すること.さもないと,データセットにどのようなバイアスがかかってい
    るか不明である.
16. ネガティブな結果も興味深い可能性がある.何が上手くいかなかったのか,
    そして何故か.全てが期待通りに成功する訳でないことは自明である.
17. 査読者は,すでに働き過ぎており,他の締切を抱え,疲れており,一杯
    やっているかもしれず,子供を寝かしつけたところである.これらを前提
    (prior)とせよ.
18. 二語:ホワイトとストランク(The Elements of Styleの著者).熟読し従
    いなさい.言葉の使い方の法則,作文の原則,品詞とスペリング,誤用さ
    れやすい言葉.
19. 質の低い内容で残りの紙面を埋めないこと.4/5の論文は不採択になる.8
    頁の優れた論文は多くある.全てのページを磨くこと.
20. 研究の貢献を明記せよ.論文の始めと終わりの両方に.また,結論は要約
    ではない.どんな変化をもたらしたのか?
21. 自分より優れた人と共著しなさい.学ぶことは多い.あなたにない素質を
    持っているはず.
22. 手を差しのべてくれた人を謝辞に入れること.礼にコストはかからない.
    忘れたコストは大きいかもしれない.大きな貢献なら共著者に入れること.

SIGIR 2017のフルペーパーアブストラクト投稿締切は2017年1月17日,フルペー
パー論文投稿締切は同月24日です.会議の詳細は以下のURLを参照してください.

SIGIR 2017: http://sigir.org/sigir2017/

(上保 秀夫 筑波大学 図書館情報メディア系 知的コミュニティ基盤研究セン
 ター 准教授)

========================================================================

--
Yasuhiro Fujiwara, Ph.D.
NTT Software Innovation Center
Tel: +81 422 59 2824