Mecab用辞書データ J-MedDict for MeCab

日本語での医療言語処理の研究・開発を促進するべく,医療テキストの解析に利用可能な辞書として,Japanese Medical NLP Dictionaries: J-MedDic を開発・公開しています.本ページでは,J-MedDic データを形態素解析器MeCab で読み込める形式へ変換したMecab用辞書をJ-MedDic for MeCab として公開していますので,ご自由にご利用ください.

We have been developing a dictionary in which universal dictionary data is converted into a format that can be used by the morphological analyzer MeCab.

百薬辞書

百薬辞書データ形態素解析器MeCab で利用できる形式へ変換したMecab用辞書です.

MeCab用辞書の利用方法

ドキュメント

Windows環境でのMeCab用辞書の使用方法 (PDF) (更新日:2018/10/29)

手順

1. 形態素解析器MeCab のインストール(参考:Mecab公式サイト本研究室でまとめた手順

  • 形態素解析器MeCab をお使いのマシンにインストールしてください.
    なお,Windows環境をお使いの場合は,必ず「SHIFT-JIS」を選択してください.  
  • Mecabが存在するディレクトリを環境変数のpathに追加してください.

2. 辞書データの読み込み

辞書データ(.dicファイル)をCドライブの直下等に配置してください.

3. 形態素解析の実行

コマンドプロンプト上で,辞書データを配置したディレクトリへ移動し,”mecab -u 辞書ファイル名” と入力してください.ユーザ辞書として辞書ファイルを読み込んで,MeCab が立ち上がります. テキストを入力すると,辞書データを適用した形態素解析結果が表示されます.

解析結果の例

例えば,万病辞書のMeCab用辞書データを読み込み(”mecab -u MANBYO_201905_Dic-sjis.dic” を実行),「今朝から片頭痛があり、胃がむかむかする。」というテキストを解析すると ,下記のように「片頭痛」と「胃がむかむかする」の解析結果に万病辞書の情報が付与されます.

万病辞書を用いた解析結果

「片頭痛」の解析結果の見方は下記の通りです.

  • へんずつう;icd=G439;lv=S/freq=高頻度;片頭痛:<しゅつげんけい;icd=ICDコード;lv=信頼度LEVEL/freq=頻度LEVEL;標準病名>ラベル
  • へんずつう:<しゅつげんけい(読み)>
  • へんずつう:<しゅつげんけい(発音)>
  • 18403:<頻度>

プライバシーポリシー

奈良先端科学技術大学院大学 ソーシャル・コンピューティング研究室(以下,本研究室)が提供する成果物のプライバシーポリシーを定めます. 使用される方は,本規約を熟読し,内容をご理解いただいた後に,使用を開始していただくようお願いいたします.

免責事項

成果物は,可能な限り細心の注意を払って開発しました. しかし,完全な信頼性や堅牢性を保証しているわけではありません. 結果的に本アプリ及びデータを使用して何らかの問題が発生した場合,提供元である本研究室は一切の責任を負いかねます. ご使用になる場合には自己責任でご活用いただくようお願いいたします.