日本データベース学会

dbjapanメーリングリストアーカイブ(2020年)

[dbjapan] 『BTSJ日本語自然会話コーパス(トランスクリプト・音声)2020年版』(国立国語研究所)公開のお知らせ

  • To: dbjapan [at] dbsj.org
  • Subject: [dbjapan] 『BTSJ日本語自然会話コーパス(トランスクリプト・音声)2020年版』(国立国語研究所)公開のお知らせ
  • From: 『BTSJ日本語自然会話コーパス』事務局 <btsjcorpus [at] ninjal.ac.jp>
  • Date: Wed, 8 Apr 2020 19:15:21 +0900
  • Arc-authentication-results: i=1; mx.microsoft.com 1; spf=pass smtp.mailfrom=ninjal.ac.jp; dmarc=pass action=none header.from=ninjal.ac.jp; dkim=pass header.d=ninjal.ac.jp; arc=none
  • Arc-message-signature: i=1; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com; s=arcselector9901; h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-SenderADCheck; bh=R2VLQP/DdZq4jIh/981lmSw3K4oWSyxuWaMERGotKgA=; b=W01JFS8aCMgkOrqoUWlgdU4YgV2CfdawVsuSoY3uOPmTcFgzBlNP34T/RVlNXWljCQs8pAblrDCE9LCQyJd+pkFPbKppXPugSG62SflbEwMIA8Px9b/VORlQ+aUmTmRYeRY3dfj7g+VWAmt/rNVToGbcf405HJKWitSjznN6GKQAxNqyJUYs9iBJkLK9Q+mH00Q3107MY89UU+SAzsSwSFUJFfPd2A0Fu+NvZV7sl12vl6GSlW/nO2QASGlBEXdjX6n1LXmaHk9InbsDvINEeakPYC+vlxOKg1MX76FMNU1zbjV3CLQcWwij6xZ9wPUycNe1RIHijQtGzIzPvluuIQ==
  • Arc-seal: i=1; a=rsa-sha256; s=arcselector9901; d=microsoft.com; cv=none; b=R3h+sNL4+0iNCaYRCm7bY9Tcsyc3D/me4F5Bjk4yH4znlZjAFQ5OKLEG78HU/5PdreX2Bi/oxRTs+kznKYM1x0ojIqxrekU4Tp/AaUqEIN2xBl+YmHKr1ee6Kgln2TVkBJDTAXvWMTFQPP7au9MxHk/QgDbpsBYUuHrLumBkiyF77H59Ujrsxj1HieGOUON9CBeDJm6EvxfWgtql3/kIgVVVp2537S/M+fp5Fnw+InmrrlUGuuA5gPgiDfsSyiIG3VOGw96YXSKvk0kimRT9tsj/jkapETbsmiGd78eVHZiD8nFVnvjtvzKRHQ7Xrbv7GbTU9BuSKDY5q7gRyN0REw==

(重複受信の場合はご容赦ください)
皆さま

 国立国語研究所宇佐美まゆみ研究室の張と申します。以下、お知らせしますので、よろしくお願いします。尚、『BTSJ』、及び、本コーパス、及び、その前身にあたる2018年版を利用して論文を執筆された方は、書誌情報がオンラインで入力できますので、下記から、その旨、ご報告いただけると幸いです。(過去のものも歓迎します。)

 「BTSJ使用報告はこちら」
https://ninjal-usamilab.info/lab/btsj_form/ または、
https://ninjal-usamilab.info/btsj_use-report/

 --------記--------

この度、国立国語研究所、機関拠点型基幹研究プロジェクト日本語教育研究領域「日本語学習者のコミュニケーションの多角的解明」、サブ・プロジェクト「日本語学習者の日本語使用の解明」(リーダー:宇佐美まゆみ)の研究成果として、『BTSJ日本語自然会話コーパス(トランスクリプト・音声)2020年版』を公開する運びとなりましたので、お知らせします。

 本コーパスは、『BTSJ日本語自然会話コーパス(トランスクリプト・音声)2018年版』の333会話に、さらに44会話を追加したもので、合計377会話、総時間5525分56秒(約92時間)の自然会話が収録されており、そのうち音声付きデータは247会話、3189分54秒(約53時間)です。本コーパスの会話データは、場面や話者同士の関係などの条件を統制して収集されており、「会話グループ」ごとにサブフォルダとして、まとめられていることが特長です。
現在公開されているシナリオのない「自然会話(トランスクリプト・音声付)のコーパス」としては、国内外を含めて最大規模のものの一つです。

本コーパスは、下記のURLから「利用申し込み」をしていただければ、無償で配布します。
URL:https://ninjal-usamilab.info/btsj_corpus/

本コーパスについての詳細情報、利用に際しての注意事項を、一読、ご確認の上、是非、お申込みください。
また、万が一、データの不備等に気づかれた方は、お手数ですが、下記事務局にご連絡くださいますようお願いいたします。
その他、本コーパスに関するお問い合わせも、下記事務局宛てにお願いします。
尚、『BTSJ』、及び、本コーパス、及び、その前身にあたる2018年版を利用して論文を執筆された方は、書誌情報がオンラインで入力できますので、下記から、その旨、報告いただけると幸いです。

 「BTSJ使用報告はこちら」
https://ninjal-usamilab.info/lab/btsj_form/ または、
https://ninjal-usamilab.info/btsj_use-report/

関連分野における研究成果を共有化することによって研究の相互促進を図ることを企図したコーパス公開ですので、是非、ご協力をお願いします。
それでは、本コーパスが、少しでも皆さんの研究のお役に立てることを期待します。


宇佐美まゆみ
国立国語研究所 日本語教育研究領域


【本コーパスに関する問合せ先】
国立国語研究所 日本語教育研究領域
『BTSJ日本語自然会話コーパス』事務局
btsjcorpus [at] ninjal.ac.jp
電話番号 042-540-4572