日本データベース学会

dbjapanメーリングリストアーカイブ(2003年)

IPSJ SIGFI 72 and SIGNL 154 program


(重複して受け取られた場合はご容赦ください)
dbjapan, SIGMOD-J の皆様,

奈良先端科学技術大学院大学の波多野です.

平成 15 年 9 月開催の第 72 回情報学基礎研究会および第 157 回自然言語処理
研究会(合同開催)のプログラムをお送りいたします.

多数のご参加をお待ちしております.

本研究会の詳しい内容は,ホームページでも公開しておりますので,以下の URL 
もご覧ください.

  http://www.ipsj.or.jp/katsudou/sig/sighp/fi/cfp/20030929/paper.html

以上,よろしくお願い致します.

波多野賢治
奈良先端大

------------------------------------------------------------
◇ 第72回 情報学基礎研究会,第157回 自然言語処理研究会(合同開催)

◎ 日 時: 平成15年9月29日(月) 10:00〜16:45
             30日(火) 10:00〜16:10

◎ 会 場: 独立行政法人 産業技術総合研究所
	   サイバーアシスト研究センター
	   〒135-0064 東京都江東区青海2-41-6 臨海副都心センター4F
	   [交通手段] JR・営団銀座線・都営浅草線 新橋駅からゆりかもめへ
	   乗り換えテレコムセンター駅下車(新橋から約20分)
	   (http://unit.aist.go.jp/waterfront/jp/access_map/access_map_main.html)

◎ テーマ: 「セマンティックウェブと自然言語処理」その他一般
	[テーマの説明]
	近年、ウェブのより高度な利用を図るため、セマンティックウェブの概念
	が脚光を浴びるようになってきました。その中で、言語情報の標準化に向
	けた動きが活発になるなど、自然言語処理技術のセマンティックウェブへ
	の適用が期待されています。今回の合同研究会では、セマンティックウェ
	ブだけでなく、XML、メタデータ、言語情報の標準化などに関連する論文を
	広く募集しました。発表論文はこのテーマに限りません。多数のご参加を
	期待しております。

〔連絡先〕・研究会に関すること
	   * 情報学基礎研究会(FI)に関する問い合わせ先:
	        中島 浩之 (NTTデータ技術開発本部)
	        Email: nakajimahr [at] nttdata.co.jp
		Tel: (03)3523-8120, Fax: (03)3523-8130
	   * 自然言語処理研究会に関する問い合わせ先:
	        内元 清貴 (通信総合研究所)
	        E-mail: uchimoto [at] crl.go.jp
	        Tel: (0774)98-6834, Fax: (0774)98-6961

     ・会場に関すること
          宮田高志(産業技術総合研究所)
          E-mail: miyata.t [at] carc.aist.go.jp
	        Tel: (03)3599-8295, Fax: (03)5530-2067

      (問い合わせはできるだけ電子メイルでお願いします)

------------------------------------------------------------
【プログラム】(発表件数17件)

9月29日(月) ― 10:00 〜 16:45 ―
  [10:00 〜 11:45] ● 基盤・要素技術        〔3件〕
  [13:00 〜 14:45] ● パタン発見          〔3件〕
  [15:00 〜 16:45] ● オントロジ・抽出(1)      〔3件〕
9月30日(火) ― 10:00 〜 16:10 ―
  [10:00 〜 11:45] ● オントロジ・抽出(2)      〔3件〕
  [13:00 〜 14:45] ● コーパス分析・言い換え    〔3件〕
  [15:00 〜 16:10] ● コーパス構築         〔2件〕
------------------------------------------------------------

9月29日(月) ― 10:00 〜 16:45 ―

[10:00 〜 11:45] ● 基盤・要素技術        〔3件〕

 1. 距離索引VP-treeにおける解絞り込みの一改良法
  ○中川嘉之, 獅々堀正幹, 北研二(徳島大学)

  距離に基づいて空間を分割するVP-treeにおいて,最近傍点を基準
  にした三角不等式を用いて解の絞り込みを行う改良手法を提案する.

 2. 多次元データの高速近傍検索アルゴリズム
  ○北研二, 獅々堀正幹, 大恵俊一郎(徳島大学)

  多次元ベクトルデータに対するきわめて高速な近傍検索(nearest 
  neighbor search) アルゴリズムを提案する。実験によると、従来
  の SR-tree や VP-tree 等よりも、 20倍〜50倍高速であり、高次
  元の場合にも性能の劣化はない。

 3. 単語の共起情報を利用した文法主導の係り受け解析
  ○八木豊, 野呂智哉, 橋本泰一, 徳永健伸, 田中穂積(東京工業大学)

  我々はすでに大規模日本語文法を開発している.この文法と単語の
  共起情報を利用した文法主導の係り受け解析について述べる.

[13:00 〜 14:45] ● パタン発見           〔3件〕

 4. 文字列の頻度分布による共通パタン発見
    ○池田大輔, 山田泰寛, 廣川佐千男(九州大学)

    複数の文字列が与えられた時、これらに共通する部分とそうでない部分の確率
    分布の差を利用し、文字列の頻度情報から共通部分を高速に特定するアルゴリ
    ズムを提案し、実データでの予備的な実験結果を紹介する。

 5. 部分木に基づくマルコフ確率場と言語解析への適用
  ○工藤拓, 松本裕治(奈良先端科学技術大学院大学)

  部分木を素性とするマルコフ確率場の提案、および頻出部分木マイ
  ニングに基づくその実現方法について発表する。さらに、品詞タグ
  付け、テキストチャンキングといった言語解析に応用し、有効性を
  検証する。

 6. 素性選択機能をもったString Kernelの提案
  ○鈴木潤, 平尾努, 磯崎秀樹, 前田英作(NTT)

  String Kernelを拡張し、全学習データの特徴から有効な素性を選
  択しつつkernelの値を計算する手法を提案する。

[15:00 〜 16:45] ● オントロジ・抽出(1)       〔3件〕

 7. Webコンテンツの分析に基づくオントロジ構築および属性抽出の試み
    ○大沼宏行, 松平正樹, 渕上正睦, 森田幸伯(沖電気)

    Webコンテンツからイベント情報に関する属性を抽出し、属性の有無や、属性
    の見出しとなる単語の出現状況を分析し、オントロジを構築した。また、それ
    ぞれの属性について抽出ルールを作成し、抽出実験をおこなった。

 8. 人間行動に基づく実世界セマンティクスの構築
    ○長沼武史, 磯田佳徳, 倉掛正治(NTTドコモ)

    Web上の情報源に対するメタデータとして、実世界における人間行動との関係
    性を付与することにより、人間中心型の高度な情報支援が可能になると考えら
    れる。本稿では、実世界における人間行動を構造化するオントロジの構築とそ
    の適用手法について考察する。

 9. 特許文献を用いた因果関係に基づく知識構造化の試み
    ○石川大介, 石塚英弘, 宇陀則彦(図書館情報大学), 
    藤原譲(工業所有権総合情報館)

    特許文献は科学技術情報が記述されているだけでなく,因果関係に関する記述
    を含むことが特徴である.本研究では,この点に着目し,因果関係を抽出,体
    系化し,特定の分野における専門知識の構築を試みた.

9月30日(火) ― 10:00 〜 16:10 ―

[10:00 〜 11:45] ● オントロジ・抽出(2)       〔3件〕

10. 複数尺度の統計的統合法とその専門用語抽出への応用
  ○内山将夫, 井佐原均(通信総合研究所)

  各尺度を次元とする多次元空間における経験分布を利用した統計的
  検定により複数尺度を統合する方法を提案し,その専門用語抽出へ
  の適用結果を報告する.

11. 定型表現を利用した新聞記事からの下位概念単語の自動抽出
  ○安藤まや(慶應義塾大学), 関根聡(ニューヨーク大学), 石崎俊(慶應義塾大学)

  「トマト+などの+野菜」のように、高い確率で下位概念が含まれ
  る表現を収集し、自動抽出に応用した。

12. 機械学習による科学技術論文からの書誌情報の自動抽出
  ○阿辺川武(東京工業大学), 難波英嗣(広島市立大学), 高村大也, 
    奥村学(東京工業大学)

  論文の書式の多様性のため,規則による抽出ではすべてを網羅する
  こと が難しい.そこで機械学習により書誌情報を自動抽出する手
  法を提案する.

[13:00 〜 14:45] ● コーパス分析・言い換え    〔3件〕

13. 大規模テストコレクション構築のためのプーリング:NTCIR3言語横断検索タスクの分析
    ○栗山和子(白百合女子大), 江口浩二, 岸田和明, 神門典子(国立情報学研究所)

    大規模テストコレクションを構築する手法としてのプーリングの有効性を検証
    するため、NTCIRワークショップ3言語横断検索タスクのデータを使用して分析
    を行なう。

14. 質問応答における言い換えの効果
  ○高橋哲朗(奈良先端科学技術大学院大学), 関根聡(ニューヨーク大学)

  質問文とその正解の含まれる文書を分析し,言い換えを用いること
  により正解を得られる質問の割合や必要となる言い換えの調査を行
  なった.

15. 特徴的冗長表現に着目した国会会議録要約
  ○安達康昭, 山本和英(長岡技術科学大学)

  国会会議録に含まれる冗長表現の中から特徴的な表現に着目し、削
  除及び言い換えにより要約を試みた。

[15:00 〜 16:10] ● コーパス構築         〔2件〕

16. 半構造化文書に対する木構造と文字列を組合せたラッパーの自動生成法
    ○山田泰寛、池田大輔、廣川佐千男(九州大学)

    同種の項目を多数含む半構造化文書から,各項目を抽出するラッパーの自動生
    成法を提案する.提案するラッパーは,抽出ルールを木構造のパスに加え,そ
    のパスを持つ葉で前後に共通する左・右句切文字列の組でより詳細に表現する.

17. Webコーパスの提案
  ○関口洋一, 山本和英(長岡技術科学大学)

  Webを良質のテキストコーパスとして利用するための加工手法を提
  案し、試作したWebコーパスの有効性を検討した。

------------------------------------------------------------