フリーの環境を使い,実践しながらひと通りの手法を学べる入門書です.ネット上にあふれる膨大なテキストデータを効率よく収集・分析する方法や,アンケート結果をデータに置き換えて分析する方法を紹介します.
初心者はもちろん,さまざまな手法を知りたいという読者にもおすすめです.
〈おすすめポイント〉
・基本的な手法のほか,ウェブスクレイピングやトピックモデルといった,最近注目の技術も紹介.
・ネットワークグラフ,ワードクラウドなどの可視化機能をふんだんに利用.データの特徴をつかむのに役立つ.
・実践には統合環境RStudioを導入.RStudioでは,マウスによる直感的な操作ができ,コードの補完機能などもあるので,簡単・快適に作業をすることが可能.
テキストマイニングの定番書を,Rのバージョンアップや新機能に対応して大幅にリニューアルしたものです.さらに使いやすく,充実した内容となっています.
第1章 テキストマイニングとは何か
第2章 テキストマイニングの準備
第3章 R/RStudio速習
第4章 文字処理と正規表現
第5章 RMeCabによるテキスト解析
第6章 口コミのテキストマイニング―ウェブスクレイピング
第7章 アンケート自由記述文の分析―対応分析
第8章 青空文庫データの解析―ワードクラウドとネットワークグラフ
第9章 テキストの分類―クラスター分析,トピックモデル
第10章 書き手の判別―漱石と鴎外の文体比較
第11章 Twitterタイムラインの分析―APIの利用
・R で日本語テキストに word2vec[2017-08-28に投稿]
・R+RMeCabで感情分析[2017-08-20に投稿]
・【データ分析の必読10冊+差をつける10冊+100冊超】データサイエンス、データ分析、機械学習関連の本[2016-08-23に投稿]