日本データベース学会

dbjapanメーリングリストアーカイブ(2008年)

[dbjapan] CFP: Wikipedia研究ワークショップ


日本データベース学会の皆様

東京大学知の構造化センターの中山と申します.
重複してお受け取りの際はご容赦ください.

人工知能学会・セマンティックウェブとオントロジー(SWO)研究会では
2009年1月22日(木),東京大学本郷キャンパスにおきましてWikipedia研究を特集
したワークショップを開催致します.締切が迫ってきましたので再度通知させて
いただきます.

このワークショップでは国内のWikipedia研究を一堂に集め,
Wikipediaを用いた最新の研究成果発表を行うほか,これからWikipediaの
データを使って研究を始める方を対象としたチュートリアルも開催致します.

現在Wikipediaを使った研究をされている方,Wikipediaを言語リソースとして
利用されている方は是非ご投稿頂ければ幸いです.

=====================================================================
     第20回 セマンティックウェブとオントロジー研究会
         Wikipediaワークショップ論文募集

■開催日:2009年1月22日(木)
■会場: 東京大学本郷キャンパス工学部2号館231号講義室
 http://www.u-tokyo.ac.jp/campusmap/cam01_04_03_j.html

== 概要 ==
近年,Web2.0文化の浸透に伴い,協調的にコンテンツを編集するスタイルの
ソーシャルメディアが発展してきました.Wikipediaはその代表例で,大量の
ユーザが書き込みを続けた結果,幅広い知識を網羅する大量の知識ネットワーク
が構築されるに至りました.

ここ数年,各種研究分野においても新しいコーパスとしてのWikipediaに大きな
注目が集まっており,WWW・自然言語処理・情報検索といった分野を中心に,
関連研究が報告されてきました.さらに,AAAI,WWW,ISWCといったトップ
カンファレンスにおいてもWikipediaに関する論文が増え,AAAIではWikiAI,
ESWCではSemWikiといった特別ワークショップが開催されてきました.

このように世界的には多くの注目を集めているWikipediaですが,国内では
様々な研究分野の研究会において,分散的に研究発表がされてきたのが現状で,
Wikipedia研究について深くディスカッションする機会が十分であったとは
いえません.そのため,本ワークショップでは,Wikipediaに関する研究者に
対して深いディスカッションをする機会を設けるために,Wikipediaの研究を
一堂に集め,集中的に議論することを目的としています.多くの方々がご発表,
ご参加され,有益な議論と情報交換が行われることを期待しております.

== トピック ==
* Wikipediaからの情報抽出
 関連・関係抽出,意味抽出,オントロジ・シソーラス構築
* Wikipedia記事の信頼性評価
* Wikipediaの統計報告
* WikipediaとセマンティックWeb
* Wikipediaと自然言語処理
* Wikipediaと多言語解析,翻訳辞書構築
* そのほかWikipediaを利用した各種研究
 情報検索,対話処理,コンテキスト解析など

---------------------------------------------------------------------
Wikipediaマイニングチュートリアル〜Wikipediaマイニングの勘どころ〜
講演者:中山浩太郎(東京大学)

== 目的 ==
Wikipediaのコーパスとしての有用性は,ここ数年でNLP,AI,Semantic Web,
IRなど各種の研究分野で広く認識されるに至りました.しかし,Wikipediaを解
析するためには,大規模データの取り扱い方法や,データベースの有効な利用方
法,ノイズデータの除去など,いくつかのポイントがあり,これらのポイントを
クリアしなければ,解析が困難である上に精度低下の要因にもなります.そこで,
本チュートリアルでは,これからWikipediaマイニングを始めようという方,は
じめたばかりの方たちの間で情報を共有することを目的とし,ケーススタディと
して,講演者の経験からいくつかポイントと思うポイントを提示します.最後に
ディスカッションの時間を設けて,より良い方法論を模索したいと思います.

== アジェンダ ==
* Wikipedia研究の要点
* mwdumper
* データベースの扱い
 インデックス
 ストアドプロシージャの勧め
* Wikipedia解析の定石
 ノイズデータの除去
 リダイレクトページのリンクを伝搬
 アンカーテキスト解析
* 大規模リンク解析
* ディスカッション

---------------------------------------------------------------------
■ 発表申込〔締切: 2008年12月22日(月)〕
 以下の発表申し込みフォームにご記入の上,
 sigswo{at}nii.ac.jp 宛てにご送付ください.

■ 原稿提出〔締切: 2009年1月15日(木)〕
 お申込み頂いた順番にページ番号をお知らせしますので,ページ番号を
 付記した原稿(A4,2〜10頁,PDFファイル)を作成し,上記のアドレス宛て
 にご送付ください.原稿作成には人工知能学会研究会スタイルファイル/
 Wordテンプレートをご利用ください.
 <http://www.ai-gakkai.or.jp/jsai/sig/style.html>

 原稿は研究会のページ <http://sigswo.org/> に掲載します(研究会資料
 の冊子は作成しておりません).なお,原稿のWeb公開に際して配慮が必要
 な場合(知財権のある場合など)は発表申込み時にその旨お知らせください.

======================発表申し込みフォーム=========================
研究会:第20回SWO研究会:Wikipediaワークショップ(2009年1月22日開催)
申込締切:2008年12月22日(月)
送付先:sigswo {at} nii.ac.jp

タイトル:
著者(発表者に○):
所属:
概要(数行で):
著者連絡先Email:

発表希望時間(以下の3つから1つ)を選び,他を削除してください。
15分(発表10分・質疑5分)
25分(発表15分・質疑10分)
35分(発表20分・質疑15分)
======================発表申し込みフォーム(終わり)=================


== 実行委員長・企画者 ==
実行委員長 :  武田 英明(国立情報学研究所)
企画者 :  中山浩太郎(東京大学),福原知宏(東京大学)
        松尾豊(東京大学),大向一輝(国立情報学研究所)

== お問い合わせ先 ==
福原知宏 (東京大学人工物工学研究センター)
E-mail: fukuhara [at] race.u-tokyo.ac.jp

以上

-- 
Kotaro Nakayama, The University of Tokyo
http://www.cks.u-tokyo.ac.jp/nakayama