日本データベース学会

dbjapanメーリングリストアーカイブ(2003年)

cfp: ntcir workshop 4


皆様

#重複してお受け取りの際はご容赦ください。

第4回NTCIRワークショップの参加募集をお送りします。日本語のアナウンスは後
半にあります。

すでにご存知の方もいらっしゃると存じますが,NTCIRワークショップは情報検
索(言語横断検索,特許検索,WEB),質問応答,テキスト自動要約を対象とし
た情報アクセス技術の評価ワークショップです。

多数のチームにご参加いただき,さまざまな角度からこれらの技術にチャレンジ
していただきたいと考えておりますので,ご検討ください。

-- 
<oyama/>
==========================================================
<発信者>大山敬三
<所属>国立情報学研究所/総合研究大学院大学 教授
<電子メール>oyama [at] nii.ac.jp
<ホームページ>http://research.nii.ac.jp/~oyama/
<所在地>〒101-8430 東京都千代田区一ツ橋 2-1-2
<電話>(03)4212 2515 <FAX>(03)3556 1916
</発信者>
--- Begin Message ---

[English Announcement]	                             March 4, 2003

                   Call for Participation

                    The 4th NTCIR Workshop

       Evaluation of Information Access Technologies:
Information Retrieval, Question Answering, and Summarization
                  Meeting: Late May 2004
            http://research.nii.ac.jp/ntcir-ws4/


The Online Registration for the 4th NTCIR Workshop has now started!
Participation is invited from anyone interested in research on
information access technologies, such as retrieval from large-scale
test collections various genres, cross-lingual information retrieval
of Asian languages, question answering and text summarization of
Japanese texts. NTCIR Workshops are periodical event which are held
once par one and half years.


TASKS: NTCIR-4 selected the following 5 areas of research as "Tasks".

1. Cross-Lingual Information Retrieval Task (CLIR)
   Multilingual CLIR, Bilingual CLIR and Pivot Bilingual CLIR, and
   Single language IR
   Languages: Traditional Chinese, Korean, English and Japanese

2. Patent Retrieval Task (PATENT)
   Main task: Invalidity Search
   Feasibility study: a step for Patent Map Automatic Creation

3. Question Answering Task (QAC)
   "5 Possible Answers", "Only One Answer" and  "Follow-up Questions"

4. Text Summarization Task (TSC)
   Multiple document summarization. The details to be announced later.

5. Web Task (WEB)
   Informational retrieval, Navigational retrieval, Geographical
   information, Topical classification


TEST COLLECTIONS:

CLIR collection includes Traditional Chinese, Korean, Japanese, English
documents published in East Asia in 1998-1999. The size of the English
and Korean document collections were increased than NTCIR-3, and the
Korean document collection published in the same year range is vailable.

PATENT collection has been extended to 10-year collection of Japanese
patent and English abstracts. NTCIR-3 PATENT, the test collection used
in PATENT at NTCIR-3 (2-year fulltext and 5-year English and
Japanese abstracts) is available for training as well as research
purpose use.

QAC and TSC use Japanese newspaper articles, published in 1998-1999,
and the number of the newspaper sources has been increased, i.e.,
using the news articles from two different newspapers.

WEB uses NW100G-01, the same Web document collection as those for
NTCIR-3. 100 GB web documents crawled in November 2001 in '.jp' domain.



OFFICIAL LANGUAGE:

The official language for the proceedings papers and the Workshop
meeting is English. Announcements will be in English, or English
and Japanese.


MEETING & PROCEEDINGS:

The final proceedings will be published online as well as printed-form.
The selected best papers will be recommended to a special issue on
NTCIR-4, ACM Transaction on Asian Language Information Processing
(ACM-TALIP).


IMPORTANT DATES:

2003-03-20:  Registration Due
2003-03-30:  Document Data Release

  Each task's evaluation schedule varies. The formal run at each task
  is planned sometime during October, 2003 -- January, 2004.

2004-02-20: Evaluation Results Release
2004-03-19: Deadline of Camera-ready manuscript for Working Notes of
             the Meeting
Late May 2004:  Meeting, NII, Tokyo, Japan


FOR DETAILS, PLEASE VISIT http://research.nii.ac.jp/ntcir-ws4/


You are most welcome!

Noriko Kando
ntcir project
---------------------------------------------------------------------
 [Japanese Announcement]	                       March 4, 2003

                   タスク参加者募集

                  第4回NTCIRワークショップ

     情報アクセス技術の評価: 情報検索、質問応答、テキスト要約
                  成果報告会: 2004年5月下旬
          http://research.nii.ac.jp/ntcir-ws4/work-ja.html

第4回NTCIRワークショップは、タスク参加登録を開始しました! WEB、特許、
新聞記事などの大規模なテストコレクションを用いた検索、アジア言語と英語の
言語横断検索、質問応答、テキスト要約に関心のある研究グループは、どなたで
も歓迎します。どうぞ、奮ってご参加ください。ワークショップは、およそ1年
半に1回開催します。


●タスク: 第4回NTCIRワークショップは、次の5つの研究部門を「タスク」と
して選択しました。

1. 言語横断検索タスク (CLIR)
  多言語/二言語間言語横断検索、ピボット言語横断検索、単言語検索
  言語:中国語(繁体字)、韓国語、日本語、東アジアで刊行された英語

2. 特許検索タスク (PATENT)
  基本タスク:無効資料調査
  実現可能性調査タスク:特許マップ自動作成を目指して(1)

3. 質問応答タスク (QAC)
  5つの回答候補、全正解を1セット、連続質問(枝問)

4. テキスト要約タスク (TSC)
  複数文書要約の評価 (詳細は後ほどお知らせします)

5. Webタスク (WEB)
  情報指向検索、ナビゲーション指向検索、地理情報、トピック分類


●テストコレクション:

CLIRコレクションの文書データは、1998-1999年に出版された中国語(繁体字)、
韓国語、日本語、(東アジアで刊行された)英語の新聞記事です。 NTCIR-3と
くらべて英語と韓国語のデータ規模が拡大しました。韓国語は他の言語と同じ出
版年のデータが利用できます。4言語ほぼ匹敵する規模の文書データを用いて評
価を行います。

PATENTコレクションは、特許と英文抄録10年分に拡張しました。 NTCR-3 PATENT
(NTCIR-3の特許タスクで使用したテストコレクション)は、訓練用データして
利用できます。

QACとTSCは、1998-1999年に出版された日本語新聞記事データを使用します。新
聞を同年代の2種類に増やしました。

WEBは、NW100G-01(NTCIR-3で使用したのと同じ文書データセット)を使用しま
す。.jpドメインでクロールした100 GBの文書データです。


●成果報告会と論文集:

会議録は、電子版と冊子体の双方で刊行します。優秀な論文は、ACM
Transaction on Asian Language Information Processing (ACM-TALIP)の
NTCIR-4特集号に推薦されます。


●使用言語:

会議録論文集と成果報告会の使用言語は、英語です。
アナウンスは、英語、もしくは、英語と日本語の二カ国語です。


●日程:
2003-03-20:  タスク参加申込み締め切り
2003-03-30:  文書データ配布開始

  スケジュールは各タスクごとにことなります。概ね、評価は2003年の
  10月〜2004年1月の間になる予定です。

2004-02-20:  評価結果を各参加者に返送
2004-03-19:  成果報告会用のWorking Notes paperのカメラレディ原稿しめきり
2004-05 下旬:  成果報告会 (東京、国立情報学研究所)


詳しくは、下記をご参照ください!
http://research.nii.ac.jp/ntcir-ws4/work-ja.html


よろしくお願いいたします。

神門 典子
ntcir project
------------------------------------------------------









--- End Message ---