News
- Aug 28, 2018
- NTCIR-13 テストコレクション (MedWeb) が参加者以外の方々も研究目的で利用できるようになりました.ご利用を希望される方はNTCIRテストコレクション タスクデータ ダウンロードページよりMedWebを選択してお申し込みください.
- Nov 30, 2017
- NTCIR-13 MedWeb タスクセッションのプログラムが公開されています. MedWeb タスクセッションは 2017年12月7日(木)午前11時から午後1時までです.その後,午後1時から午後2時30分までポスターセッションも開催されます.
- Oct 11, 2017
- 論文を提出したタスク参加者に,論文チェック結果を送付しました.論文を提出したにも関わらず,結果を受け取っていないグループは,タスクオーガナイザーまでご連絡ください.
- Sep 18, 2017
- フォーマルラン結果を提出したタスク参加者に,タスクオーガナイザペーパー(ドラフト)を送付しました.
- Sep 4, 2017
- フォーマルラン結果を提出したタスク参加者に,評価結果を送付しました.フォーマルラン結果を提出したにも関わらず,評価結果を受け取っていないグループは,タスクオーガナイザーまでご連絡ください.
- Aug 8, 2017
- フォーマルラン結果の提出を締め切りました.
- July 24, 2017
- テストデータを公開しました(タスク参加者は,以前ご案内しておりますデータアクセスページから取得できます).
- July 5, 2017
- 学習データの修正版を公開しました(タスク参加者は,以前ご案内しておりますデータアクセスページから取得できます).
- July 4, 2017
- 日本語版と英語版のアノテーションガイドライン修正版を公開しました(アノテーションガイドラインとデータセットを参照してください).
- May 2, 2017
- 学習データの配布を開始しました.NTCIR-13 MedWeb 参加者用覚書の提出が完了したタスク参加者へ,NTCIRオフィスより順次メールで連絡があります.データセットの詳細についてはアノテーションガイドラインとデータセットを参照してください.
- タスクの内容が変更になりました(タスク概要を参照してください).
- Apr 21, 2017
- NTCIR-13 MedWeb 参加者用覚書が公開されました.
- Apr 10, 2017
- Twitter サブタスク参加者へ:日本語版と英語版のアノテーションガイドラインを公開しました(アノテーションガイドラインとデータセットを参照してください).
- Blog サブタスク参加者へ:残念ながら,Blog サブタスクの開催を中止することになりました.なお,Twitter タスクは予定通り実施いたします.
MedWeb (Medical Natural Language Processing for Web Document) へようこそ
近年,多くの医療記録がこれまでの紙の媒体に代わり,電子媒体の形式で作成されるようになっており,医療分野でのデジタル情報処理の重要性が増しています.さらに,このトレンドは医療者によって作成される電子カルテだけでなく,患者による様々なテキスト,マイクロブログテキストやブログテキストなど,にも広がっています. NTCIR-13 MedWeb (Medical Natural Language Processing for Web Document) タスクでは,患者によるテキストを用いて言語処理の課題に挑みます. MedWebタスクで得られる成果により,ソーシャルメディアにおける患者らの声を有効に活用し,医療をサポートする実用的なシステムを生み出すことを目指しています.
タスク概要
Twitter タスク (日本語サブタスク,英語サブタスク,中国語サブタスク)
本タスクでは,任意のツイートに対して,8つの病気または症状(インフルエンザ,下痢/腹痛,花粉症,咳/喉の痛み,頭痛,熱,鼻水/鼻づまり,風邪)への罹患の有無を割り当てるマルチラベル分類を行っていただきます. タスク参加者には,参加登録したサブタスク(日本語サブタスク,英語サブタスク,中国語サブタスク)に応じた学習データとテストデータが配布されます. 学習データは8つの病気または症状の有無に対するラベルが付与されたツイートテキスト,テストデータはラベルが付与されていないツイートテキストです. データセットの詳細についてはアノテーションガイドラインとデータセットを参照してください.
アノテーションガイドラインとデータセット
アノテーションガイドライン
- 日本語版
- 英語版
データセット
タスク参加者には,参加登録したサブタスクに応じて,8つの病気または症状(インフルエンザ,下痢/腹痛,花粉症,咳/喉の痛み,頭痛,熱,鼻水/鼻づまり,風邪)に関するツイートデータを配布します. なお,Twitterから収集したツイートデータの再配布は禁止されているため,クラウドソーシングにより作成した模擬ツイートデータのコーパスを用います. 英語と中国語のコーパスは,日本語で作成した模擬ツイートデータを翻訳して構築されています.
- 日本語サブタスク:学習データ1,920 発言,テストデータ640 発言(計2,560 発言)
- 英語サブタスク:学習データ1,920 発言,テストデータ640 発言(計2,560 発言)
- 中国語サブタスク:学習データ1,920 発言,テストデータ640 発言(計2,560 発言)
(1) 学習データ(5/1公開)(7/5更新)
8つの病気または症状それぞれに対して陽性 (Positive:p) または陰性 (Negative:n) のラベルが付与されたツイートテキスト 1,920 件(コーパスの75%).
ID | Tweet | Influenza | Diarrhea | Hayfever | Cough | Headache | Fever | Runnynose | Cold |
---|---|---|---|---|---|---|---|---|---|
8888ja | インフルつらすぎ | p | n | n | n | n | p | n | n |
(2)テストデータ(7/24公開)
ツイートテキスト 640 件(コーパスの25%).
スケジュール
Dec 5-8, 2017 | NTCIR-13会議 @ NII (O)(P) MedWeb タスクセッションは 2017年12月7日(木)午前11時から午後1時まで,ポスターセッションは午後1時から午後2時30分までです. |
*(P) はタスク参加者のスケジュール, (O) はタスクオーガナイザのスケジュールです.
参加登録
参加登録を締め切りました.NTCIR-13 タスクへの参加方法
運営組織
オーガナイザー
荒牧 英治 (奈良先端科学技術大学院大学) |
若宮 翔子 (奈良先端科学技術大学院大学) |
森田 瑞樹 (岡山大学) |
狩野 芳伸 (静岡大学) |
大熊 智子 (富士ゼロックス) |
アドバイザ
増市 博 (富士ゼロックス)
スポンサー
Link
NII IDR(テストコレクションをダウンロードしていただけます)
NTCIR MedNLP-Doc
NTCIR MedNLP-2
NTCIR MedNLP-1
mednlp.jp
国立情報学研究所 NII
NTCIR-13