日本データベース学会

dbjapanメーリングリストアーカイブ(2020年)

[dbjapan] DBSJ Newsletter Vol. 13, No. 6: ACM/IEEE JCDL 2020, ACM RecSys 2020, ACM Multimedia 2020, ACM CIKM 2020, ACM ICMR 2020

  • To: dbjapan [at] dbsj.org
  • Subject: [dbjapan] DBSJ Newsletter Vol. 13, No. 6: ACM/IEEE JCDL 2020, ACM RecSys 2020, ACM Multimedia 2020, ACM CIKM 2020, ACM ICMR 2020
  • From: Yuanyuan WANG <y.wang [at] yamaguchi-u.ac.jp>
  • Date: Tue, 1 Dec 2020 08:24:58 +0900

┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2020年12月号 ( Vol. 13, No. 6 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
冬晴れが心地よい師走の候,皆様におかれましてはお変わりなくお過ごしでしょ
うか.ますますご多忙の時期に恐れ入りますが,お体にお気をつけて良き新年を
お迎えください.一日も早い新型コロナウイルス感染症の終息と,皆様のご健康
とご多幸をお祈り申し上げます.

さて,本号では, 8月に開催されました,図書館情報学分野のトップカンファレ
ンス「ACM/IEEE JCDL」をはじめ,9月および10月に開催されました,推薦システ
ム,マルチメディアや情報検索,データベース,ナレッジマネジメントおよびマ
ルチメディア検索分野での最重要国際会議「ACM Multimedia」,「ACM CIKM」と
「ACM ICMR」についてご寄稿いただきました.それぞれの会議の特徴や最近の傾
向,トップカンファレンスへの投稿のメリット,論文採択に至るまでの工夫など,
皆様のご参考になれば幸いです.

本号ならびに DBSJ Newsletterに対するご意見あるいは次号以降に期待する内容
についてのご意見がございましたらnews-com [at] dbsj.orgまでお寄せください.



                                日本データベース学会 電子広報編集委員会
                        (担当編集委員 王 元元)

=======================================================================

----
目次
----

1. ACM/IEEE JCDL 2020 参加報告
   山本 祐輔  静岡大学

2. ACM RecSys 2020 参加報告
   関 喜史  株式会社Gunosy

3. ACM Multimedia 2020 参加報告
   李 吉屹 山梨大学

4. ACM CIKM 2020 参加報告
   村本 尚生 筑波大学

5. ACM ICMR 2020 参加報告
   富樫 陸 早稲田大学

=======================================================================

■1■ ACM/IEEE JCDL 2020 参加報告         山本 祐輔 (静岡大学)
                                      
2020年8月1日から5日までの間,オンラインにて開催された,ACM/IEEE Joint
Conference on Digital Libraries (JCDL) 2020に参加してきました.JCDLは,
デジタルライブラリに関する主要な国際会議です.一般的な計算機科学の国際
会議との大きな違いは,研究者・技術者以外に図書館員の方も参加されている
のが特徴的です.デジタルライブラリというと図書館をイメージしますが,
JCDLでは情報検索やデータマイニング,HCI,デジタルヒューマニティーズ,
インターネットプライバシなど,情報アクセスシステムの理論と実践にかかる
トピックを幅広くカバーしています.

JCDL 2020は,当初6月中旬に中国は武漢で開催される予定でした.しかし,
COVID-19の影響を受け,開催地がいったんは西安に変更され,最終的にはオン
ライン開催になりました.例年JCDLは北米,ヨーロッパ,アジアと世界中の様
々な国から参加者が集まりますが,今年度は発表件数はFull paperが33件(採
択率31%),Short paperが 28件(採択率31%),ポスター・デモが48件とそれ
ほど規模が大きくなかったため,実行委員会の配慮で地域ごとにセッションが
まとめられました.そのおかげで,日中の時間帯に自身の発表が行うことがで
き,肉体的には楽でした.一方で,ヨーロッパや北米の方の発表の多くは,ヨ
ーロッパ時間・北米時間の日中(日本時刻で深夜・早朝)に行われていたため,
積極的に聴講することはなかなか難しかったです.オンラインでの学会開催の
難しさを感じました.

本年度のJCDLは,以下のようなセッションがありました:
Scholarly Communication,User in Search,Digital Libraries,
Scholarly Knowledge,Document Classification,Natural Language Processing,
Web Archive,Digital Humanities,Domain Specific Applications,
Scholarly Data,Content Annotation,Search and Recommendation,
Network and Learning,Neural Semantic Representation, Practitioner.
ご覧の通り,幅広いトピックについて研究発表が行われたのですが,科学技術
論文のコンテンツ・ネットワーク解析による知識獲得セッション(Scholarly X)
が複数あることに目を引かれました.また,図書館員の方々が実践報告を行う
Practitionerセッションにデジタルライブラリの学会らしさが感じられました.

私はUser in Searchというセッションで,下記発表を行いました:
Yusuke Yamamoto and Takehiro Yamamoto: Personalization Finder: A Search
Interface for Identifying and Self-controlling Web Search Personalization.
https://doi.org/10.1145/3383583.3398519
この研究では,ウェブ検索中のユーザがウェブ検索結果のパーソナライゼーシ
ョンの影響を認識し,調整することを可能とする検索インタフェース
「Personalization Finder」を提案しました.私の研究グループが事前に行っ
たユーザ意識調査では,ウェブ検索ユーザの多くは,意見の分極化の原因にな
りうるウェブ検索結果のパーソナライゼーションが政治トピックに対して行わ
れることを懸念していることが明らかになりました.その一方,一般的なウェ
ブ検索エンジンでは政治トピックに対する検索結果パーソナライゼーションが
行われているにも関わらず,多くのユーザがそのようなパーソナライゼーショ
ンはあまり行われていないと思っていることも明らかになりました.この結果
を踏まえ,自身が閲覧しているウェブ検索結果リストのうちパーソナライズさ
れている結果をあえて可視化し,パーソナライゼーションによって逆に見えな
くなってしまった結果を確認できるインタフェースを設計し,それらがユーザ
の検索行動に与える影響を分析しました.ユーザ実験の結果,特に政治トピッ
クの検索時において,提案インタフェースを用いると,ユーザは客観的に情報
を収集するべく,検索結果リストをより長く閲覧するようになり,より下位の
検索結果を閲覧するようになることを明らかにしました.幸運なことに,本論
文はBest Paper Awardに選ばれました.

DBSJの広報担当者の方から本報告の執筆依頼をいただいた際,トップカンファ
レンスに採録されるための工夫・苦労した点について記してほしいとのご要望
をいただきました.採録のための秘訣についてはこれまでも優れた研究者の方
々が語ってくださっていますし,私自身はそれを語れるほどの経験はありませ
ん.ですので,大層なことは言えませんが,「不採択を恐れずトップカンファ
レンスに論文を投稿して,査読者から有益なフィードバックをもらうこと」は
有効だと思います.

トップカンファレンスは査読者の質も相対的に高いため,論文を改善したり,
研究をより良い方向に進めるために有益なフィードバックがたくさん得られま
す.実は今回の採択された論文は, ACM CHIという別のトップカンファレンス
に投稿して不採択になった論文をブラッシュアップして再投稿したものです.
レビューコメントは大変痛烈で,不採録判定による傷心状態で読むのは気が滅
入ります.しかし,数日寝かせて読み直すと,どのコメントも鋭く的を得てい
るものばかりでした.それを改善すれば確実に研究が進展します.おかげさま
で,レビューで指摘された穴を一個一個つぶしてアップデートした論文は,
JCDL 2020に採択されました.不採録通知を受け取ることはショックですが,
採択率からすると大抵のひとにとって不採録はデフォルトです.良質なレビュ
ーコメントをもらって論文と研究をアップデートし,めげずに投稿し続けるこ
とが,ターゲットとする国際会議に論文を通す近道だと,リジェクトの結果に
凹んでは自分に言い聞かせています.


(山本 祐輔  静岡大学 情報学部 講師)

-----------------------------------------------------------------------

■2■ ACM RecSys 2020 参加報告         関 喜史 (株式会社Gunosy)

2020年9月22日から26日まで開催された 14th ACM Conference on Recommender
Systems,通称RecSys 2020に参加してきました.RecSysは情報推薦に関するト
ップカンファレンスです.予定通りであれば本年はブラジルのリオデジャネイ
ロで開催予定でしたが,昨今の情勢のなかでオンラインでの開催になりました.
参加者数は 1,168名と過去最高で,比率として学術:産業で 36%:64% と産業
側の参加が多いことが特徴となっています.研究論文は LongとShortに分かれ
ており,投稿数は Longが218件,Shortが128件でした.投稿総数はここ数年で
大きく変わらなかったものの,今年は投稿数におけるLongの比率がこれまでよ
り10%ほど増えていました.採択率はLong 18%, Short 20%, 日本からの採択は
4件となり,全体でフランス・ドイツと同数の4番目でした.
(1位がアメリカの16件,2位が中国とオランダの5件)

オンラインでの開催においては RecSys ならではの工夫がありました.RecSys
は例年,本会議はシングルセッションで行われるという特徴があります.今年
はシングルセッションの上,さらに各セッション 2回の発表機会が設けられて
いました.例えば日本時間の深夜 1時からのセッションは日本時間の正午12時
からも実施されます.発表者は両方のセッションに参加し,発表と質疑を行い
ます.これにより,参加者は自分のタイムゾーンに合った時間にセッションに
参加することができます.他の学会では開催地(主にアメリカ)のタイムゾー
ンに合わせて生活しなければならず大変でしたが,RecSysでは十分な睡眠をと
って参加することができました.発表時間もタイムゾーンが考慮されており,
そのため私が発表したセッションは日本人 4件の発表がすべて集まっていまし
た.このように参加者が活発に議論を行うための工夫がなされているのが,
RecSysの特徴だと思います。

全体としてはバイアスへの注目の高まりを感じました.3つのKeynoteは形は違
えど,それぞれがバイアスに関する講演だったといえます.第1の Keynote は
インディアナ大学の Filippo Menczer氏による「4 Reasons Why Social Media
Make Us Vulnerable to Manipulation」でした.こちらはソーシャルメディア
におけるバイアスに関する講演で,フェイクニュースの拡散やエコーチェンバ
ー現象などと,プラットフォームの特性や推薦システムとの関わりについて議
論されていました.第2の Keynote は元Yahoo! LabのVPである Ricardo Baeza
-Yates氏による「Bias in Search and Recommender Systems」でした.こちら
では推薦システムのアルゴリズムや評価プロセス自体に含まれるバイアスにつ
いて広く議論されていました.第3の Keynote は Chatbotプラットフォームを
提供している Juji.inc の Michelle Zhou 氏による「"You Really Get Me":
Conversational AI Agents That Can Truly Understand and Help Users」で
した.この発表では推薦システムにおいて心理学の観点でシステム評価を行っ
ている研究について,チャットボットを中心に議論しています.推薦システム
の評価にあたっては,究極的にはユーザがサービスで推薦システムをどう感じ
るかということを直接評価したいですが,難しいのでいろいろな代替指標を用
いており,その結果バイアスが生まれているという側面があると私は考えてい
ます.そのためこちらの講演もバイアスを論じる上では重要な話だと感じまし
た.研究トラックでも評価やバイアスに関する発表が多く,チュートリアルや,
Workshopでも数多くのトピックで扱われていました.注目の高まりを感じると
ともに,バイアスという言葉がかなり大きな意味を持つようになってきている
ことを懸念しています.研究トピックや研究者によってバイアスという言葉の
意味や,研究目的にばらつきがあると感じており,このあたりの整理が今後行
われていくことを期待したいです.

最後に私自身の研究について紹介をさせていただきます.今回「A Method to
Anonymize Business Metrics to Publishing Implicit Feedback Datasets」
というタイトルで Long Paperが採択されました.昨年度もShort Paperが採択
されており,2年連続での採択となりました.今回の研究は理研AIPの前原さん
との共著で,データセット公開におけるデータ匿名化を最適化問題として定義
したものです.特に暗黙的フィードバックのデータにおけるビジネスKPI の漏
洩に対する対策を重視したもので,プライバシー以外を匿名化する試みは我々
の知る限りはじめての研究になります.本研究のきっかけは Twitterで私がこ
の研究に関するアイデアをツイートしたことに前原さんが反応していただいた
のがきっかけで,その後 COVID-19 の影響もあり,すべてオンラインで研究を
進めました.前原さんとは直接の面識はそれ以前にもなかったので、一度も対
面することなく行った研究となりました.本研究のでは当社からデータ公開も
行うことができました.企業にとってデータ公開を行うことは容易な手続きで
はないですが,現代の研究では重要な意味を持ちます.また多くの実サービス
に関わるデータセットが海外サービスから出ている現状がある中で,国内企業
からデータセット公開が活発に行われることで,研究を行っている学生の皆さ
んが日本の産業界に目を向けていただけるきっかけにもなることを期待してお
り,自社で公開していくだけでなく,公開を後押しするような取り組みを実施
していきたいと考えております.

現代において推薦システムは当たり前の技術になりつつあり,そんな中で
RecSysは推薦システムが抱える問題について先進的で有意義な議論を行うこと
ができる会議です,ぜひ投稿・参加を検討いただき,国内での推薦システムの
議論がより活発になることを望みます.



(関 喜史  株式会社Gunosy 上席研究員/共同創業者)

-----------------------------------------------------------------------

■3■ ACM Multimedia 2020 参加報告          李 吉屹 (山梨大学)

The 28th ACM International Conference on Multimedia (MM 2020) has been
held online on October 12-16, 2020. I would like to give a brief report
of this conference as follows.

1. Conference
ACM Multimedia is an international conference that focuses on the
research and applications of multimedia, including but not limited to
images, text, audio, speech, music, sensor, and social data. The
conference committee planned to hold this conference in Seattle, USA.
However, because of the coronavirus disease pandemic. It was held
online finally. The total number of submissions of papers is 1698; 1602
papers are sent to review. There is a significant increase in submissions
over previous years (2017: 189/684; 2018: 269/757; 2019: 252/936; 2020:
474/1698). The hottest topic is deep learning for multimedia which has
571 submissions. 1.7% of authors are from Japan in all 5498 authors.
The acceptance rate is 474/1698 (27.9%), in which 144/1698 (8.5%) papers
are accepted as oral presentations.

During the main conference, there are three types of programs, i.e.,
main conference single track live sessions, pre-recorded videos, and
live question answering (QA) sessions.  Considering the time difference,
the authors of the papers are required to attend the live QA sessions
twice in 24 hours with an interval of 12 hours. Each paper has a separate
Zoom room. However, the communications are quite a few at the QA sessions.
The virtual conference is convenient because there is no long trip to
the venue. However, the discussions are quite less than a face-to-face
conference. How to promote communications for the online conference is
a challenging issue for future virtual conferences.

2. Keynotes
2.1. The talk given by Shuicheng Yan from Yitu Tech is "Neural Network
Design for Multimedia: Bio-inspired and Hardware-friendly". Neural
network architecture design is important in the recent fast development
of multimedia technology. Targets for neural network design are based
on diverse scenarios, e.g., small model, accurate prediction, or fast
inference. There are two challenges, i.e., one is that there is no well
-studied theory on the generalization capability of the specific trained
neural network; the other is that the best network architecture is task-
dependent, data-dependent, and also hardware-dependent. This talk mainly
introduces the efforts in designing neural networks from two aspects,
i.e., one is how these neural network models are bio-inspired; the other
is how these models are more hardware-friendly or motivating the next
generation of AI.

2.2. The talk given by Klara Nahrstedt from University of Illinois at
Urbana-Champaign is "360-Video Navigation for 360-Multimedia Delivery
Systems: Research Challenges and Opportunities". It focuses on the multi
-modal contents from the 360-degree cameras, microphones, and VR/AR
display devices. Streaming 360-degree videos to enhance user experience
on mobile devices is required. This talk discusses the research
challenges of 360-degree video delivery systems and quality control for
the user experience.

3. Best Paper Award
The best paper is "PiRhDy: Learning Pitch-, Rhythm-, and Dynamics-aware
Embeddings for Symbolic Music", which is a paper by a research group from
Nankai University (China) and National University of Singapore (Singapore).
It is a really interesting work, which concentrates on the representation
learning for the music score sheets (symbolic music) by computational
musicology in deep learning.  Analogous to natural language, music can
be modeled as a sequence of tokens. It provides a comprehensive solution
by proposing a novel framework named PiRhDy that integrates pitch, rhythm,
and dynamics information seamlessly. It verifies the embeddings with
three downstream tasks, i.e., melody completion, accompaniment suggestion,
and genre classification.

H. Liang et al., "PiRhDy: Learning Pitch-, Rhythm-, and Dynamics-aware
Embeddings for Symbolic Music", In: MM '20, pp. 574-582, October 2020.

4. Our Paper
Our paper is related to affective image annotation, crowdsourcing, human
computer interface. The title is "AffectI: A Game for Diverse, Reliable,
and Efficient Affective Image Annotation". It is accepted as an oral
paper. Recent deep learning technologies have led to a growing demand
for affective image annotation technologies to build large reliable
training datasets. This paper proposes a novel affective image
annotation technique, AffectI, for efficiently collecting diverse and
reliable emotional labels with the estimated emotion distribution for
images based on the concept of Game With a Purpose (GWAP). AffectI
features three novel mechanisms: a selection mechanism for ensuring all
emotion words being fairly evaluated for collecting diverse and reliable
labels; an estimation mechanism for estimating the emotion distribution
by aggregating partial pairwise comparisons of the emotion words for
collecting the labels effectively and efficiently; an incentive
mechanism shows the comparison between current player and her opponents
as well as all past players to promote the interest of players and also
contributes the reliability and diversity. Our experimental results
demonstrate that AffectI is superior to existing methods in terms of
being able to collect more diverse and reliable labels. The advantage
of using GWAP for reducing the frustration of evaluators was also
confirmed through subjective evaluation.

In addition, our group also have several crowdsourcing papers published
this year. I would like to list them here and look forward to more
discussions and cooperation in the future.
- Jiyi Li, Yasushi Kawase, Yukino Baba, Hisashi Kashima,
 "Performance as a Constraint: An Improved Wisdom of Crowds Using
 Performance Regularization",
 the 29th International Joint Conference on Artificial Intelligence
 (IJCAI 2020), pp. 1534-1541, Jul. 2020.
- Jiyi Li,
 "Crowdsourced Text Sequence Aggregation based on Hybrid Reliability
 and Representation",
 the 43rd International ACM SIGIR Conference on Research and
 Development in Information Retrieval (SIGIR 2020), Virtual event,
 pp. 1761-1764, Jul. 2020.
- Xingkun Zuo, Jiyi Li, Qili Zhou, Jianjun Li, Xiaoyang Mao,
 "AffectI: A Game for Diverse, Reliable, and Efficient Affective
 Image Annotation",
 the 28th ACM International Conference on Multimedia (MM 2020),
 Virtual event, pp. 529-537, Oct. 2020.
- Yukino Baba, Jiyi Li, Hisashi Kashima,
 "CrowDEA: Multi-view Idea Prioritization with Crowds",
 the 8th AAAI Conference on Human Computation and Crowdsourcing
 (HCOMP 2020), Virtual event, 8(1), pp. 23-32.

This is a brief report of attending MM 2020. If you are interested in
any issues and have questions, please feel free to contact me.


(李 吉屹  山梨大学 大学院総合研究部 助教)

-----------------------------------------------------------------------

■4■ ACM CIKM 2020 参加報告                村本 尚生 (筑波大学)

2020年10月19日から23日にかけて開催された情報検索,データベース,ナレッ
ジマネジメントのトップカンファレンスであるCIKM 2020に参加してきました.
今回のテーマは「Data and knowledge for the next generation:
sustainability, transparency and fairness」であり,最もホットなワード
は「graph」でした.論文の採択率はロングが20%,ショートが26%でした.

今年はアイルランドのゴールウェーで開催される予定でしたが,COVID-19の影
響でバーチャルでの開催となりました.バーチャル会議がどのように行われる
か気になる方も多いのではないかと思うので,紹介したいと思います.

CIKM 2020はwhovaという会議用アプリケーションを使用して行われました.こ
のアプリはスマートフォン・PCどちらからでも利用できます.このアプリを通
じて,プログラムを閲覧できたり,他の参加者や主催者とチャットできたりし
ます.他の参加者と連絡先を調べなくともチャットでやり取りできる点はバー
チャル会議の利点だと感じました.各セッションには whovaを通じてzoomに入
り参加できます.質疑応答についてもzoomを通じて行われるのですが,オンラ
イン開催の影響なのか全体的に質問は少なかったように思います.

国際会議をバーチャルで行う際に気になるのはやはり時差ではないでしょうか.
今回はアイルランド開催の予定だったことから,アイルランド時間(GMT+1)
で行われました.日本時間では,一番早いセッションは 14:00から,一番遅い
セッションは4:00からでした.発表時間について,申し込み時に希望を調査す
るなどの配慮はあったものの,私の発表時間は深夜12時過ぎと少し辛い時間帯
でした.それでも,日本(GMT+9)やアメリカ西海岸(GMT-8)などと比べると
アイルランドの時間はバーチャル国際会議には適していたように思えます.

次に私の論文について紹介します.「Deep Metric Learning Based on Rank-
sensitive Optimization of Top-k Precision」というタイトルでショートペ
ーパーに採択されました.この論文では,ランキング情報を利用し,top-k
precisionを最適化する deep metric learning手法を提案しました.パラメー
タがモデルに及ぼす影響や提案手法の強み・弱みについての考察と分析が評価
され,採択に至りました.実験結果がなぜ良かったかだけでなく,なぜ悪かっ
たかについても深く考察することの重要性を改めて感じました.

最後に発表についてですが,ショートペーパーの発表は録画済みのビデオを流
し,その後質疑応答という流れで行われました.初めての国際会議での質疑応
答かつ英語が得意ではないということで,質疑応答について準備はしていまし
たが,頂いた2つの質問は想定外の質問でした.その質問になんとか答えました
が,終わってみて考えると,もっと上手く答えられたなと反省しています.全
体を通じて他の参加者を見ていると全員当たり前のように英語で議論しており,
改めて英語の重要性を目の当たりにしました.

来年の CIKM 2021 はオーストラリアのゴールドコースとで行われる予定です.
是非参加をご検討下さい.


(村本 尚生  筑波大学 図書館情報メディア研究科 于研究室)

-----------------------------------------------------------------------

■5■ ACM ICMR 2020 参加報告                富樫 陸 (早稲田大学)

2020年10月26日から29日に開催された ICMR 2020 (International Conference
of Multimedia Retrieval, 2020) に参加致しました.ICMR は,マルチメディ
ア検索に関する話題を主に扱う国際会議の一つであり,関連分野から多数の研
究者が参加します.会議では,テクニカルセッションの他,招待講演,併設国
際会議,ワークショップ,チュートリアルが開催され,いずれのセッションに
おいても活発な議論行われます.今年は COVID-19の影響により,本来2020年4
月に予定されていたアイルランド・ダブリンにおける現地開催を延期した後,
依然として状況が改善されないことを考慮して,2020年10月に全面的にオンラ
インで開催される運びとなりました.Live発表はZoomで行い,後に録画内容の
視聴や非同期の Q&Aがポータルサイトで可能でした.現地開催に比べると研究
者同士のコミュニケーションは減っているようにも感じましたが,非同期の質
問が可能であったり,録画を見直すことで気になる発表をよく理解できるとい
うメリットもありました.状況によっては今の状況が来年以降も続くものと思
われ,デメリットに関しては一層の改善が期待されます.


本年度はワークショップ4件,チュートリアル2件,論文47件,ポスター及びデ
モ論文34件からなる発表が行われました.論文に関する口頭発表のあるセッシ
ョンのタイトルは,Retrieval,Cross Modal Analysis,Semantic Enrichment,
Applications,Human-Centric Cross-modal Retrieval,Activities of Daily
Living,Best Paper Session,Brave New Ideas のようになっていました.こ
の他にもshort/demo論文のセッションがありました.全体を通して,検索を主
に扱うセッション以外に複数モーダルに関する分析を扱うものが多くあり,マ
ルチメディアを扱う幅広い研究を受け入れている印象でした.

Best Paper Sessionでは,Visual scene graphを活用した Cross-modal検索の
手法を提案した(1)「Visual Relations Augmented Cross-modal Retrieval」,
画像と文章を含むニュース記事内に現れるEntityのモーダル間一貫性を考慮し
た分析システムを提案した(2)「Multimodal Analytics for Real-world News
using Measures of Cross-modal Entity Consistency」,人間と周辺に現れる
物体との Interactionを検出するタスクHuman object interaction detection
(HOID)における手法を提案した(3)「Human Object Interaction Detection via
Multi-level Conditioned Network」,Fine-grained visual classification
(FGVC)におけるSemantic attributeを用いた予測説明を与える手法を提案した
(4)「Explaining with Counter Visual Attributes and Examples」が発表さ
れていました.いずれも異なるタスクの研究ではありますが,個別の意味論的
な対象を認識することを超えて,対象同士の高次の Interactionを扱うことで
より現実的で難しい問題に取り組んでいるという意味で,共通点の多い研究だ
ったかと思います.高次の Interactionを陽に扱うために Scene graphを使う
(1),Knowledge graphとして扱う (2),タスクとして扱う (3),Attributeと
して扱う(4) などの色々なアプローチが,ある側面で一つの方向性に向かって
いるのは大変興味深いと個人的に感じました.

私は「Automatic Evaluation of Iconic Image Retrieval based on Colour,
Shape, and Texture」というタイトルの論文で Brave New Ideas Trackにて採
択され口頭発表を行ってきました.この論文では,画像間の類似度に基づいて
ランキングを行うタスクである類似画像検索における低コストな評価方法論を
提案しています.個人的な経験ではありますが,典型的な Webアプリケーショ
ンにおいて,意味論的な情報がカテゴリやテキストとして画像に付随する状況
が多く,あえて画像情報から認識する理由が薄いことがありました.一方で,
類似画像検索の品質評価においては,むしろ色・形・テクスチャなどの非意味
論的な低次の画像的特徴に関する適合性判定が困難であるという課題感から始
めた研究です.これは先に説明した高次の意味論的対象の認識と,ある意味で
逆行する方向性かと思いますが,Brave New Ideas というセッションというこ
ともあってか口頭発表として採択されました.提案手法では,hand-crafted特
徴を事前知識として用いることで,適合性判定を一切作らずに類似画像検索に
おける段階的適合度に基づく評価指標を計算する方法論を提案しています.

2021年度のICMRは7月に台湾・台北で開催されます.論文の締切は2021年2月21
日になります.締切までの期間は些か短いですが,ぜひ投稿をご検討ください.


(富樫 陸  早稲田大学 大学院基幹理工学研究科 酒井研究室)
=======================================================================

--
王 元元
山口大学大学院創成科学研究科
工学系学域・知能情報工学分野
(兼担:工学部知能情報工学科)
助教 博士(環境人間学)
y.wang [at] yamaguchi-u.ac.jp
circl.wang [at] gmail.com
0836-85-9522

Yuanyuan Wang, Ph.D
Assistant Professor, Department of Information Science and Engineering, College  of Engineering,
Graduate School of Sciences and Technology for Innovation, Yamaguchi University, Japan 
E-mail: y.wang [at] yamaguchi-u.ac.jp
       circl.wang [at] gmail.com
Tel: +81-836-85-9522