コンテンツへスキップ

「日本語病名抽出システムMedNER-J」を公開しました

本研究室で開発している日本語病名抽出システムMedNER-J を公開しました.
本システムは,MedEX/J の上位バージョンに相当するシステムです.

非公開: 日本語病名抽出システム MedNER-J

これまで多くの日本語形態素解析器が開発されてきましたが, 医学文章の解析においては,十分な精度が出ていませんでした. この理由の1つは,従来の形態素解析は,新聞などの汎用的な文章を想定し, 特に医療に特化していないことにあります. また,形態素という単位が,もっぱら抽出したい対象である薬品名や病名よりも小さく, いわゆる,細切れになってしまった医学用語の扱いが問題となっていました. そもそも,多くの専門用語は複合名詞であり,形態素解析のみで用語を抽出することは無理な処理です.
このような問題を解決するために,MedNER-J は,形態素ではなく,病名用語抽出に特化しました.また,後処理として,ICD10への標準化,事実性判定など,臨床的に重要な処理も組み込んでいます. 

なお,MedNER-J は,MedEX/J の上位バージョンに相当するシステムです.