万病辞書 Manbyo-Dictionary

臨床現場で実際に使われる病名を解析するための大規模な病名辞書

医療文書から病名を抽出する処理は,これまで医療言語処理分野の研究では盛んに行われてきました.病名抽出にはICDのような標準規格で規定された病名を用いることがほとんどでした.しかし,実際の医療現場では,正式名称ではなく略記や英語名を用いることが少なくありません.そのため,定型的な病名コードだけでは症状や病名に関する情報をすべて抽出したいといった要望には応えることができません. そこで,ソーシャル・コンピューティング研究室では,医療従事者が記載した電子カルテや退院サマリから,症状や病名に関連する語を広く抽出したデータを作成し,万病辞書と名付けました. 本ページでは,万病辞書データや万病辞書データを検索できる万病検索を公開していますので,ご自由にご利用ください.

ダウンロード

◆ 万病辞書データ

<最新バージョン>

 

<過去バージョン>

仕様

万病辞書の抜粋

万病辞書 (MANBYO_202106以降) の構成

詳細はデータに含まれるREADMEをご覧ください.
カラム名 説明
出現形 電子カルテや退院サマリから抽出された症状・病名 (例:11β−水酸化酵素欠損症, 18常染色体異常等)
出現形よみ 出現形のよみがな(全角). 信頼度LEVELがSの病名は,ICD10対応標準病名マスターに記載されている病名表記カナをもとに付与.上記以外の病名は,「万病辞書 よみがなくん」により自動付与し,一部人手により修正.なお,読みの候補が複数存在する場合は,音読みを優先.(誤りがある場合もございますので,参考までにお使いください)
ICD10コード 出現形に対応する,ICD10対応標準病名マスター (*1) に記載されているICD10コード.ただし,次の場合には -1を付与:1) 4つ以上のコードが存在する場合(3つまでは区切り文字には;(半角セミコロン)を用いて全て付与),2) 断⽚的な情報のみで判断が困難な場合,3) コードが存在していない場合
標準病名 出現形に対応する,ICD10対応標準病名マスター (*1) に記載されているICD10対応標準病名
信頼度レベル ICD10コードや標準病名のコーディングに対する信頼度を表す.
S: ICD10対応標準病名マスター (*1) に記載されている症状・病名
A: 2名以上の医療従事者が同じコードを付与
B: 2名以上の医療従事者が相談してコードを付与
C: 1名の医療従事者がコードを付与
D: 計算機が自動的に付与
E: 新規に追加された症状・病名のうち,万病辞書に収載済み病名のICD コードと標準病名を元に,計算機が自動的に付与
F: 新規に追加された症状・病名のうち,万病辞書に収載済み病名のICD コードと標準病名を元に,計算機が自動的に付与
頻度レベル 本研究室で収集した医療文書における出現形の出現頻度を降順でソートしたときの順位を5%ごとに区切ったレベル(95-100%など20段階)を付与.出現頻度が0の場合には「出現なし」を付与
*1: ICD10対応標準病名マスター (V4.04 2018年4月1日改訂) を利用

万病検索

万病辞書内のデータを検索することができるWebサービスです.

アンケート

万病辞書について,ご意見・ご要望がございましたら,下記よりご回答ください.お答えいただいた内容は,今後の万病辞書の改善のための貴重な資料として使わせていただきます.

謝辞

「万病辞書」は主に厚生労働科学研究費補助金「カルテ情報の自動構造化システムと疾患数理モデルの逐次的構築,及び,自動構造化機能を有した入力機構の開発」(研究代表者:荒牧英治)のサポートにて,奈良先端科学技術大学院大学と東京大学医学部附属病院により構築されました.

プライバシーポリシー

本サイトに記入された個人情報は,サイト運営に必要となる連絡,サイトの評価,サイト上での表示,本サイトで提供するサービスの必要に限り使用し,それ以外の用途には使用しません.

免責事項

本成果物は,可能な限り細心の注意を払って開発しました.しかし,完全な信頼性や堅牢性を保証しているわけではありません.結果的に本成果物を使用して何らかの問題が発生した場合,提供元である奈良先端科学技術大学院大学 ソーシャル・コンピューティング研究室は一切の責任を負いかねます.ご使用になる場合には自己責任でご活用いただくようお願いいたします.

クリエイティブ・コモンズ・ライセンス

本成果物は クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。