AI研究所 - AI(人工知能)に脅かされないために、AI(人工知能)を作る側の人間になる -

HOME  >  R言語とは?実例から書き方までR言語について徹底解説

公開日:2020.03.15 [最終更新日]2020.08.02

R言語とは?実例から書き方までR言語について徹底解説

プログラミング

R言語とは?実例から書き方までR言語について徹底解説

R言語とはどのようなものかご存じですか。
データ解析や機械学習を得意としたプログラミング言語で、それらの仕事をする時には知識があるといいでしょう。
これから、R言語の概要と特徴・メリット・デメリットなどをご説明します。
また、役立つパッケージもご紹介しますので、参考にしてください。

R言語の概要

R言語とは

R言語は1995年に開発されたプログラミング言語の一つです。
科学者と大学の研究者によって開発されました。
すでに開発されていたS言語をベースにして、データ解析や統計プログラムにおける「ユーザーの使いやすさ」に焦点を当てた言語です。
公開された後は、研究や学術分野で利用されていましたが、徐々に民間企業でも導入をしています。
R言語のインストールはオープンソースになっているため、誰でも無料でダウンロードすることが可能です。
R言語はデータ解析に特化したプログラミング言語で、使用する環境は限られていますが、人気や需要が高いプログラミング言語の一つです。
その理由として、データ解析の需要が高まっていることがあります。
機械学習をする研究者や企業も増えていて、研究やビジネスをする上でデータ解析が必要になっているのです。
R言語は大きなデータを取り扱えるだけでなく、大きい労力も消費しないため、データ解析をする時には必要なプログラミング言語でしょう。

R言語の用途や実例とは?

R言語の用途は「データや統計の解析」「機械学習」です。
データや統計の解析では、統計学を使ってデータを解析します。
その際、データ解析を容易で便利に使える機能が、R言語には備わっているのです。
例えば、折れ線グラフや円グラフなどのさまざまなグラフを出力できます。
機械学習とは、人間が自然に行う学習能力をコンピューターでも実現させることです。
つまりデータからコンピューターが学習し、特徴やパターンを見つけ出していきます。
それに利用できるのが、データ解析などを得意としたR言語なのです。
R言語はグラフを作成する時の関数に、柔軟に対応できる言語です。
また作ったグラフの保存形式では、PNGやJPEG・BMP・PDFなどの拡張子もあります。
よって特別な設定をしなくても、R言語をインストールすればグラフの作成やグラフを画像保存することが可能です。
R言語を書く時には、テキストファイルからデータフレームを読み出すことから始まります。
まずは主な引数を理解することが大切です。
ファイル名は「file」、列を区切る時の記号として「sep」、ファイルで使う引用符として「quote」などがあります。
そしてデータフレームを書き込み、書式付で出力をするのです。
R言語が必要な職業とは、データや統計解析などをしている人です。
R言語の知識があると即戦力になれるでしょう。
具体的には「機械学習エンジニア」「データサイエンティスト」「ビジネスアナリスト」「データアナリスト」などがあります。
特にデータを解析することで、企業や商品・サービスにおける課題を見つける仕事が多いです。
課題を見つけてから分析などをして、状況を改善させるための提案をしています。

R言語のメリットとデメリットとは?

R言語のメリット・デメリット

R言語のメリットは、データや統計の解析がしやすいことです。
ユーザーの使いやすさに焦点を当てたため、グラフ作成や画像保存を簡単に行える機能が備わっています。
そして、データの分析後に、可視化できるのです。
また、ソースコード自体が簡単で、勉強をした人はR言語を習得できます。
さまざまなプログラミング言語がありますが、その中でも学習に時間や手間がかからない言語の一つでしょう。
さらに、R言語は複数のパッケージが公開されていて、必要に応じて選択できます。
特に、機械学習のサポートをするパッケージが豊富です。

R言語のデメリットは、データ・統計の解析と機械学習以外はできないことです。
R言語を学習したとしても、仕事でデータ解析以外をする場合は、他の言語も学ばなくてはなりません。
機械学習を実装する場合は、他のプログラミング言語を用いる場合もあります。
また、R言語は日本語のリソースが乏しいこともデメリットです。
国内で使っているのはエンジニアや研究者などが多く、利用者は限定的になっています。
よって、他のプログラミング言語と比べると、リソースは少なくなってしまうでしょう。
万が一R言語で不明点が出ても、英語のドキュメントや海外サイトを参考にしながら解決することが多くなります。
用途が似ているとしてよく比較される言語に「Python」があります。
こちらの記事にPythonの詳しい説明がされているのでご覧になってください。

R言語で使えるパッケージとは?

R言語には機械学習のサポートをする複数のパッケージがあります。
例えば、「dplyer(ディプライヤー)」「stringr(ストリンガー)」「ggplot2(ジージープロットツー)」「caret(キャレット)」などです。
今回はそれぞれ1つずつご紹介していきます。

dplyerとは?

「dplyer」は、データフレーム操作に特化しています。
データの絞り込みや並び替え・追加などができ、関数の組み合わせでグルーピングすることも可能です。
大きなデータを取り扱えるため、大規模データの操作を効率良く行うには、dplyerがあるといいでしょう。

stringrとは?

R言語で文字列の操作をしたい時に利用するのが「stringr」です。
R言語では標準でも文字列操作ができる関数が用意されています。
しかし、それだけでは限界があり、効率良く文字列の操作をする時には、stringrがあるといいのです。
例えば、パターン認識や文字列の置換・正規表現を使った抽出などが行えます。テキストを扱う時に役立つパッケージです。

ggplot2とは

「ggplot2」は、データを可視化したい時に役立ちます。
標準でもデータの可視化できる機能「plotコマンド」を備えているため、グラフの描写をすることは可能です。
ただし、複雑なグラフを描写したい時には限界があります。複雑かつ綺麗な描写がしたい場合は、ggplot2があるといいでしょう。

caretとは?

「caret」は機械学習におけるさまざまなタスクがまとまったパッケージです。
「機械学習ライブラリ」とも呼ばれています。caretは複雑なタスクも効率的に処理できることが特徴です。
例えば、データ解析の前処理やデータ分割・特徴選択などができます。
また、機械学習に関するアルゴリズムとして、「ランダムフォレスト」「線形回帰」「ロジスティック回帰」「ニューラルネットワーク」などが組み込まれているのです。

R言語のインストール方法

R言語はオープンソース言語のため、無料でインストールすることができます。
OSもWindowsとMac、Linuxに対応。
今回はWindows10 64bitのパソコンにR言語とR Studioをインストールする手順を解説します。
統計学の研究やデータサイエンティストになりたければR言語の理解は必須。
解析処理を実際に動かしてみて、学んでいきましょう。

CRANにアクセス

R言語

R言語をインストールするには、まずCRAN(The Comprehensive R Archive Network)のWebサイトにアクセスします。
シーランまたはクランと呼ばれることが多いですね。
今回はWindowsでのインストール方法のため、サイトから「Download R for Windows」のリンクをクリックします。
初めてR言語をインストールする場合は、「install R for the first time」のリンクへ進みましょう。
更に進んでexeファイルをダウンロードします。

R言語

便利な統合開発環境RStudio

R言語

RstudioとはR言語の統合開発環境(IDE)のことです。
なぜIDEをインストールするのかと言えば、実はR言語そのもの、特にWindows版は使いにくいのですね。
統合開発環境であるRstudioを通じてR言語に触れる方が操作も簡便です。
まずはRstudioの公式サイトにアクセスしましょう。
DesktopバージョンかServerバージョンかを選びます。
今回はDesktopバージョンでインストールを選択します。
無料版か有料版を選択します。(今回は無料版を選択)
「DOWNLOAD RSTUDIO FOR WINDOWS」をクリックしダウンロードを開始します。

R言語

Rstudioからのパッケージのインストール

Rstudioからもdplyrやstringrなどのパッケージを容易にインストールできます。
画面右側のPackageタブに移動すると、現在インストールされているパッケージを確認できます。

R言語
新たにパッケージをインストールするには、Packageタブのすぐ下にあるinstallをクリックし、install Packageダイアログを出します。
ダイアログに追加したいパッケージの名前を入力してinstallボタンを押せばOKです。

R言語

R言語まとめ

R言語を使うことで、データや統計解析が容易にできます。
また、解析や機械学習の需要が高まっているため、理解していると今後に便利なプログラミング言語の一つでしょう。
R言語はソースコードが簡単で、習得がしやすいところも特徴です。
これを参考に、R言語をデータ解析や機械学習に役立てください。


参考になったら「いいね!」と「シェア」をお願いします!!

このエントリーをはてなブックマークに追加
AI(人工知能)セミナー開催中