日本語での医療言語処理の研究・開発を促進するべく,医療テキストの解析に利用可能な辞書として,Japanese Medical NLP Dictionaries: J-MedDic を開発・公開しています.本ページでは,J-MedDic データを形態素解析器MeCab で読み込める形式へ変換したMecab用辞書をJ-MedDic for MeCab として公開していますので,ご自由にご利用ください.
We have been developing a dictionary in which universal dictionary data is converted into a format that can be used by the morphological analyzer MeCab.
<過去バージョン>
- MANBYO_201907_MecabDic [UTF-8] / [SHIFT-JIS]
- MANBYO_201905_MecabDic [UTF-8] / [SHIFT-JIS]
- MANBYO_201810_MecabDic [UTF-8] / [SHIFT-JIS]
- MANBYO_201806_MecabDic [UTF-8] / [SHIFT-JIS]
<過去バージョン>
MeCab用辞書の利用方法
ドキュメント
Windows環境でのMeCab用辞書の使用方法 (PDF) (更新日:2018/10/29)
手順
1. 形態素解析器MeCab のインストール(参考:Mecab公式サイト,本研究室でまとめた手順)
- 形態素解析器MeCab をお使いのマシンにインストールしてください.
なお,Windows環境をお使いの場合は,必ず「SHIFT-JIS」を選択してください. - Mecabが存在するディレクトリを環境変数のpathに追加してください.
2. 辞書データの読み込み
辞書データ(.dicファイル)をCドライブの直下等に配置してください.
3. 形態素解析の実行
コマンドプロンプト上で,辞書データを配置したディレクトリへ移動し,”mecab -u 辞書ファイル名” と入力してください.ユーザ辞書として辞書ファイルを読み込んで,MeCab が立ち上がります. テキストを入力すると,辞書データを適用した形態素解析結果が表示されます.
解析結果の例
例えば,万病辞書のMeCab用辞書データを読み込み(”mecab -u MANBYO_201905_Dic-sjis.dic” を実行),「今朝から片頭痛があり、胃がむかむかする。」というテキストを解析すると ,下記のように「片頭痛」と「胃がむかむかする」の解析結果に万病辞書の情報が付与されます.
「片頭痛」の解析結果の見方は下記の通りです.
- へんずつう;icd=G439;lv=S/freq=高頻度;片頭痛:<しゅつげんけい;icd=ICDコード;lv=信頼度LEVEL/freq=頻度LEVEL;標準病名>ラベル
- へんずつう:<しゅつげんけい(読み)>
- へんずつう:<しゅつげんけい(発音)>
- 18403:<頻度>
プライバシーポリシー
本サイトに記入された個人情報は,サイト運営に必要となる連絡,サイトの評価,サイト上での表示,本サイトで提供するサービスの必要に限り使用し,それ以外の用途には使用しません.
免責事項
本成果物は,可能な限り細心の注意を払って開発しました.しかし,完全な信頼性や堅牢性を保証しているわけではありません.結果的に本成果物を使用して何らかの問題が発生した場合,提供元である奈良先端科学技術大学院大学 ソーシャル・コンピューティング研究室は一切の責任を負いかねます.ご使用になる場合には自己責任でご活用いただくようお願いいたします.
本成果物は クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。