【準備】 まず書籍「Rテキストマイニング入門」などの指示にしたがって、 RとRstudio、MeCabのインストールが完了させる。 (初回のみ) install.packages("RMeCab", repos="http://rmecab.jp/R") install.packages("dplyr") install.packages("wordcloud") install.packages("RColorBrewer") RStudioの「環境設定」で「General」→「Default working directory」を 作業スペースとして分かりやすい場所を設定しておくとよい。 (日本語の文字化けについてはネット上の情報を参照して 「.Rprofile」という名前のファイルをテキストエディタで作成 し、Default working directoryに設定した) 【参考】 MacOSのR/RStudioでplot関数で作図する際に、日本語の文字化けを治す方法 https://qiita.com/purple_jp/items/6626ec1ea4e34c7d45b1 ***************************** 解析したいテキストがSample.txtとしてDefault working directoryに あるものとする。 【テキスト解析→グラフ化まで】 RStudioにて以下の操作を行う。 #RMeCab読み込み library(RMeCab) Kaise #dplyr(パイプ処理という操作ができるライブラリ) library(dplyr) #名詞を抽出して、「kaiseki2」という中に入れる library(RMeCab) kaiseki2 <- docDF("sample.txt", type=1, pos="名詞") #並び替え、上位50語 library(dplyr) kaiseki2 %>% arrange(sample.txt) %>% tail(50) #グラフで表示(min.freqがグラフに登場させる最小頻度の設定) library(wordcloud) wordcloud(kaiseki2$TERM, kaiseki2$sample.txt, min.freq=4, colors=rainbow(7))