KatsuhiroBlog

妻と娘が大好きな現役エンジニア。IT、ブログ、投資を中心に発信します。

IT

PythonでMeCabを使う方法【絶対にインストールが失敗しない方法教えます】

更新日:

  • PythonでMeCabを使いたいが、やり方がわからない。
  • Mac、Windowsでインストール方法が違ってよくわからない。
  • インストールが失敗して挫折しそう。誰か助けて!

こういった質問にお答えします。

こんにちは、かつひろです。

私は9年間システムエンジニアをやっています。実際の業務でPython、MeCabを使っています

私も最初のインストール作業でかなり手間取りました。

Pythonに限らずですが、最初のインストール作業って、Mac、Windowsでやり方が違うし、バージョンによってやり方が違ったりするので、無駄に時間がかかってしまいますよね。

では、私がどうしたかというと、「Google Colab」というものを使いました。

「Google Colab」はGmailアカウントさえあれば、インターネット上でいつでも使えるPythonの実行環境です。

「Google Colab」はインストールが一切不要なので、無駄にインストールで困ることはありません。

今回は「Google Colab」で、「MeCab」を使用する方法をお話しします。

Python、MeCabの組み合わせ(自然言語処理)が使えるようになると、今後重宝される人材になれます。その理由についてもお話しします。

以下の順番で進めていきます。

  1. 「Google Colab」で「MeCab」を使う方法
  2. 自然言語処理に強いと今後重宝される人材になれます
スポンサードサーチ

「Google Colab」でMeCabを使う方法

MeCabを使うためには以下の手順を実施します。順番にお話しします。

  • 「Google Colab」を起動
  • 「MeCab」のインストール
  • 「MeCab」のインポート
  • 「MeCab」の使用

「Google Colab」を起動

「Google Colab」を起動しましょう。

右上の「ログイン」を押してログインしてください。Gmailアカウントでログインできます。

「ファイル」→「Python3の新しいノートブック」を押しましょう。

以下の画面が表示されます。これで準備完了です。


「MeCab」のインストール

次に「MeCab」をインストールしましょう。

!apt-get install  mecab libmecab-dev mecab-ipadic mecab-ipadic-utf8
!pip install mecab-python3

上記ソースコードをコピーしてください。そして「Google Colab」に貼り付けましょう。

「Shift」+「Enter」で実行しましょう。

これで「MeCab」のインストール完了です。

「MeCab」のインポート

次にインストールした「MeCab」を呼び出し(インポート)ましょう。

import MeCab

上記ソースコードをコピーしてください。そして「Google Colab」に貼り付けましょう。

「Shift」+「Enter」で実行しましょう。

これで「MeCab」のインポート完了です。

「MeCab」の使用

これで「MeCab」を使用する準備ができたので、使用してみましょう。

tagger = MeCab.Tagger('-Ochasen')
print(tagger.parse('わたしの名前は田中太郎です'))

上記ソースコードをコピーしてください。そして「Google Colab」に貼り付けましょう。

「Shift」+「Enter」で実行しましょう。

ちゃんと実行できましたね。文章内の単語をちゃんと認識してくれています。

これで、好き内容に「MeCab」を使えるようになります。

一度「Google Colab」を閉じた場合は、「MeCab」のインストールからもう一度作業してください。

「MeCab」の使い方は以上です。

自然言語処理に強いと今後重宝される人材になれます

画像認識、音声認識、自然言語処理など、AI技術はいくつかあります。

今後伸びしろが一番あるのが、自然言語処理です。

画像認識、音声認識の分野は、すでに人間の精度を超えています。

具体的には画像認識は「顔認証」、音声認識は「Googleの音声認識」など、みなさんの身近に浸透してますよね。論文もたくさん出ています。

しかし、自然言語処理の分野はまだまだ成長途中です。

特に日本語の文章を人間と同じようにAIが理解するのは難しいです。

例えば、英語であれば「I like sushi」のように単語の間にスペースがあるのでわかりやすいです。

しかし、日本語は「私は鮨が好きです」のように、単語と単語の区切りがわかりづらく、うまく認識できないのです。

日本語の自然言語処理の論文はあまり出ていません。

このように自然言語処理は、まだまだ発展途上の伸びしろのある分野であるということがわかると思います。

なので、Python、MeCabをちゃんと理解し、自然言語処理に強くなれば、今後重宝される人材になれます。

最後に

PythonでMeCabを使う方法について、説明しました。

  • 「Google Colab」で「MeCab」を使おう
  • 自然言語処理に強くなり重宝される人材になろう

がポイントでした。

以上です。

-IT

かつひろ

妻と娘が大好きな30代のシステムエンジニアです。家族と一緒に自由な暮らしを得るために、毎日ブログをコツコツ更新中。

プロフィール詳細