日本データベース学会

dbjapanメーリングリストアーカイブ(2013年)

タスク参加募集 NTCIR-11 Mathタスク(2014.1.20締切)


日本データベース学会の皆様

国立情報学研究所の相澤です。NTCIR-11数式検索タスクのご案内です。
ご興味の方は参加をご検討下さい。


*************** 参加募集 : NTCIR-数式検索タスク ***************
                        NTCIR-11 Math-2
           http://ntcir-math.nii.ac.jp/
        NTCIR-11 の参加登録締切:  2014年1月20日(月)
***************************************************************

◆概要
NTCIR-11 Math2は、文書中の数式を検索する手法のための参加型タスクです。
参加者は、数式のXML表記法であるMathML(http://www.w3.org/Math/ )を使っ
て表された数式を、MathMLの木構造や周辺テキストなどを手がかりに検索して、
クエリごとのランキング結果を提出します。

◆データセット
NTCIR-11 Math2では、KWARCプロジェクト(http://kwarc.info/kohlhase/ )に
よってlatexからXMLに変換された10万文書の英語科学技術論文を対象とします。
この中には、MathMLで表現された約3,500万個の数式(単項式を含む)が含まれ
ています。たとえば、大規模な木構造の検索、言語・テキスト解析に基づく情
報検索、数学知識の利用など様々なアプローチが可能なデータセットとなって
いますので、ご興味の方は是非タスクへの参加をご検討下さい。

なお、NTCIR-11 Math-2の文書集合はNTCIR-10 Math Pilot Taskと同じですが、
タスクへの参加を容易にするため、Math-2 では、文書を複数の検索単位に分割
したデータセットを新たに配布する予定です(通常の検索手法が適用しやすく
なります)。NTCIR-10のデータセットは KWARCプロジェクトから入手可能です。
詳細はタスクオーガナイザにお問い合わせ下さい。

◆タスクのスケジュール概要(予定)
2014年2月    : 文書データセットとサンプルクエリ配布
2014年5月-6月: クエリ配布と結果提出
2014年9月-10月: 人手判定済データ配布
2014年12月   : NTCIR-11

◆参加方法
以下の NTCIR-11 タスク参加申し込みページよりお申込み下さい。
  http://research.nii.ac.jp/ntcir/ntcir-11/cfp-tasks.html
NTCIRのタスクへの参加者は、1) NTCIR-11ワークショップへ論文投稿(査読な
し)、および、2) NTCIR-11ワークショップへの参加が求められますのでご注意
下さい。

◆タスク・オーガナイザ
Akiko Aizawa, National Institute of Informatics, Japan
Michael Kohlhase, Jacobs University Bremen
Iadh Ounis, University of Glasgow

◆問合せ先
ntcadm-math [at] nii.ac.jp
(日本語または英語でお気軽にお問合せ下さい。)