この記事では初学者が自然言語処理を学ぶためのお勧めの書籍を5冊紹介したいと思います。
自然言語処理と言うと難しいイメージがあってとっつきにくい感じがするかと思います。でも大丈夫です!
しっかりと本を選んで学んでいけばしっかりステップアップすることができますよ!
そのためにこの記事では、 自然言語処理の概要、数学的な基礎、機械学習や深層学習による自然言語処理、プログラミングをしたくないまたはできない人のための自然言語処理実践本をそれぞれ紹介していきます。
ご自身に合った本を選んで勉強してみて下さいね!
自然言語処理のおすすめ本 5冊
1. 自然言語処理(放送大学出版)
自然言語処理〔改訂版〕 (放送大学教材)
まず初めに初学者から読んで欲しいのがこの自然言語処理と言う放送大学出版の本です。
ひと口に自然言語処理といっても多くの分野の総称ですから、その中には様々な領域があります。
この本ではその自然言語処理と言う分野における様々な学習領域をわかりやすく紹介してくれています。
さらにわかりやすいだけでなく、とても簡潔に200ページ程度でまとめられているためストレスなく最後まで読むことができます。
この本を読んでおけば自然言語処理という学問分野の概要をざっと理解することができるので、ぜひ一度読んでみてほしいと思います。
2. 言語処理のための機械学習入門
言語処理のための機械学習入門 (自然言語処理シリーズ)
この本は自然言語処理を理解するための数学的な背景をしっかりと基本から説明している本です。
自然言語処理は機械学習の知識を用いて表現するわけですが、その機械学習の基本的な部分を理解するのにとても役立ちます。
ですから数学的な背景をベースにしっかりと置き換え自然言語処理を学びたい方はぜひ読んでほしいところです。
言語というふわっとしたものをどうやって数学に落とし込んでいくのか、どうやってコンピューターで処理していくのか、どうやって定量的に分析していくのか、そういった点を知るためにとても良い教材だと思います。
また、この本は「言語処理のための」と言われていますが、言語処理に限らず機械学習全般を学ぶためにもとても有用な本です。
機械学習で使うもしくはそれ以前の基本的な数学的知識・アルゴリズム等が書かれています。
ですが数学には自信がないとか、数学を見るのはストレスだという方は、最初はスキップしてもいいかもしれません。
そういった方は実際に手を動かすことができる本や、もしくはプログラミングを行わずにGUIでテキスト分析ができる5のような本をもとに勉強してみるのが良いかと思います。
3. 機械学習・深層学習による自然言語処理入門
機械学習・深層学習による自然言語処理入門 (Compass Booksシリーズ)
実際にプログラミングをやって自然言語処理をやってみようという趣旨の本です。
もちろんプログラミングだけでなく、理論的な説明もあるので理論を学びながら手を動かして自然言語処理を身につけることができるナイスな本です。
ここまで紹介した2冊は自然言語処理自体の概要や基礎数学がメインになっていたので、プログラミング的な側面はありませんでしたが、この本でプログラミングを実践できます。
最初にMini condaによる環境設定のやり方も書いてあるので、環境とかどうしたらいいかわからないという方も心配いりません。書いてあるとおり、写経していけば大丈夫です!
内容としてはscikit-learnを使って機械学習の範囲の自然言語処理やTensorFlowを使って深層学習の範囲の自然言語処理も行うことができます。
データの前処理から特徴量エンジニアリング、ニューラルネットワークの実践、形態素解析、テキスト分類、などなど幅広いのです。
これを一通りやっておけば自然言語処理がなんたるか、そして実践がある程度できるようになるので、この本を一旦の目標とするのがよいのではないかなと思います。
4. ゼロから作るDeep Learning 2
ゼロから作るDeep Learning ❷ ―自然言語処理編
有名な本です。
ゼロから作るDeep Learning シリーズの2は自然言語処理をディープラーニングでやろうという目的で、ディープラーニング部分を一から作って学んで行こうという趣旨の本です。
なので内容はディープラーニングになります。
3の本の後半で少し自然言語処理もやるんですが、そのバックの理論とかをしっかり学びたいという人はこの本を使って基礎からプログラミングをしながら学んでいくとよいかと思います。
ただ、機械学習の範囲内まででよいという人はスキップしてOKです。
5. 社会調査のための計量テキスト分析―内容分析の継承と発展を目指して【第2版】 KH Coder オフィシャルブック
社会調査のための計量テキスト分析―内容分析の継承と発展を目指して【第2版】 KH Coder オフィシャルブック
この本は少し毛色が違います。
3, 4はプログラミングをする本になっていますが、 この本はプログラミングは一切せずにKH coderというGUIソフトでテキストマイニングをやってみようという本になります。
KH coderを作成した立命館大学樋口先生の著書でKH coderの使い方から、実際の使用例(というか実際の研究内容)まで紹介されており、テキスト分析が研究の分野でどんな感じで行われているのかをイメージするのにもいいかと思います。
自然言語処理の詳しい話はないですが、どういうかんじで定量的にテキストを分析するかというのをポチポチとソフトを動かすだけでできちゃいます。
数学とかプログラミングとかやりたくないけど、仕事的にテキストを分析しないといけないという方はとりあえずこれをやってみるといいかと思います!
使い方はUdemyにもコースがあるので、そちらも興味ある方は見てみるとよいでしょう。
https://www.udemy.com/course/kh-coder/
最後に
今回の記事では自然言語処理を学ぶ時の書籍を5冊紹介しました。
なるべく偏らないように載せておいたので、個人によってふさわしいものを選んで読んでみていただきたいです。
自然言語処理を基礎から理論もプログラミングもがっつり学びたい人は、1, 2, 3, 4と順番に読むのがよいかと思います。
逆にプログラミングはせずに自然言語処理の概要と簡単なテキスト分析をしたい人は1, 5をやるのがよいでしょう。
みんなで楽しく自然言語処理を勉強しましょうね!