臨床現場で実際に使われる医薬品名を解析するための大規模な医薬品名辞書
医療文書から病名や医薬品名を抽出する処理は,これまで医療言語処理分野の研究では盛んに行われてきました.しかし,実際の医療現場では,医薬品の一般名ではなく略記や英語名を用いることが少なくありません.そのため,定型的な一般名だけでは医薬品に関する情報をすべて抽出したいといった要望には応えることができません.そこで,ソーシャル・コンピューティング研究室では,医薬品に関連する語を広く抽出したデータを作成し,“百薬辞書”と名付けました.本サイトでは,百薬辞書ならびに関連データを公開していますので,ご自由にご利用ください.
ダウンロード
◆ 百薬辞書データ
<最新バージョン>
- HYAKUYAKU_202107 (updated: 2021/07/06)
<過去バージョン>
- HYAKUYAKU_202007 (updated: 2020/10/27)
仕様
百薬辞書の抜粋 (HYAKUYAKU_202107 ver.)
百薬辞書の構成 (HYAKUYAKU_202107 ver.)
カラム名 | 説明 |
---|---|
出現形 | 本研究室で収集した医療文書から抽出された医薬品名(全角) |
出現形よみ | 出現形のよみ(全角) |
一般名 | 出現形に対応する医薬品の一般名(全角).KEGG DRUG Database などをもとに,出現形の化学構造を反映した名称を付与.一般名が決まらない場合には [AMB],[NON],[TRE] を付与 |
[AMB]: 出現形の曖昧性が高い場合 | |
[NON]: 出現形が医薬品ではなくサプリメントや健康食品などの場合 | |
[TRE]: 出現形が医薬品ではなく治療法である場合 | |
信頼度レベル | 一般名などのコーディングに対して付与した信頼度.なお,収載済みの情報を元に計算機が自動的に付与,あるいは,未コーディングの場合は値なし |
A: 2名の医療従事者のコーディングが同じ | |
B: 1名の医療従事者のコーディングをもう1名が修正 | |
C: 1名の医療従事者がコーディング | |
頻度レベル | 本研究室で収集した医療文書における出現形の使用頻度に基づき5%区切りで付与した20段階のレベル |
プライバシーポリシー
本サイトに記入された個人情報は,サイト運営に必要となる連絡,サイトの評価,サイト上での表示,本サイトで提供するサービスの必要に限り使用し,それ以外の用途には使用しません.
免責事項
本成果物は,可能な限り細心の注意を払って開発しました.しかし,完全な信頼性や堅牢性を保証しているわけではありません.結果的に本成果物を使用して何らかの問題が発生した場合,提供元である奈良先端科学技術大学院大学 ソーシャル・コンピューティング研究室は一切の責任を負いかねます.ご使用になる場合には自己責任でご活用いただくようお願いいたします.
本成果物は クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。