AI研究所 - AI(人工知能)に脅かされないために、AI(人工知能)を作る側の人間になる -

HOME  >  Kaggleの入門を秒で終わらせるステップとは?Kaggleを徹底解説

公開日:2020.08.06 

Kaggleの入門を秒で終わらせるステップとは?Kaggleを徹底解説

プログラミング

初心者から上級者まで幅広い層が参加しているKaggle。
機械学習を学んでいるとKaggleにも登録をしている人が多いですが、そもそもKaggleとはどんなサービスなのでしょうか。
また、Kaggleを始めたいけれどもどのような知識を身に着けてから挑戦すれば良いのかわからないという人もいるでしょう。
そこでここでは、Kaggleとは何かに加え、Kaggleの入門ステップについても解説していきます。

Kaggleとは

Kaggleを簡単に説明すると機械学習のコンペです。
PythonとR言語に対応しており、Kernel(カーネル)と呼ばれるブラウザ上で動く実行環境で構築を行います。
そのため、Kaggleで機械学習プログラムを組むにあたってPythonやR言語の環境構築を行う必要はありません。
それに、初心者でも簡単にプログラムを組めるように色々なパッケージも用意されているので、PythonやR言語の環境構築を自分のPCで行ってから学習を始める前に、Kaggleを使ってある程度学習を進めてから、自分のパソコンでプログラムを組んでみるというのも良いでしょう。

Kaggleにはメダルが存在します。
ちなみに銅メダル・銀メダル・金メダルの3種類があり、獲得できる条件はコンペの参加者によりますが、銅メダルは上位10%~40%、銀メダルは上位20%、金メダルは上位10%となっています。
Kaggleのコンペ参加者は金メダル獲得を目指して参加している人が多いですが、初心者だとまずは銅メダル獲得を目指して取り組むと良いでしょう。

また、メダルを獲得するなどすると称号も得られます。
称号はGrandmaster、Master、Expert、Contributor、Noviceの5種類。
Kaggleに登録した段階でNoviceからスタートし、プロフィールを完成させるなどすることでContributorに、そして、銅メダル2つ以上でExpert、金メダル1枚・銀メダル2枚でMaster、そして金メダル5枚とコンペでの単独1位を獲ることでGrandmasterを獲得できます。

Kaggleの入門を秒で終わらせるステップ

Kaggleにチュートリアルは用意されていません。
そのため、自分で練習手段を見つけ、スキルを磨く必要があります。
それでは、Kaggleを始めるにあたってどんなことをすれば良いのか、入門までの流れを見ていきましょう。

プログラミングについて学ぶ

まずKaggle以前にプログラミング経験が無いという人の場合、コンペに挑戦する前に、Kaggleの””learn””というコースを選択し、機械学習やデータサイエンスについて学ぶのが良いでしょう。
プログラミング学習サイトは最初は無料でもある程度レッスンを進めると有料となっていることが多いですが、KaggleではPythonはもちろん、SQLなど他のプログラミング言語を学ぶにあたって必要な知識も無料で身に付くので、有効活用してください。

練習問題に挑戦してみよう!

いきなりコンペに参加することに抵抗がある人もいるでしょう。
そんな時は練習問題に挑戦してみるのがおすすめです。
Kaggleの練習問題は、メニューのCompeteの”Getting Started”カテゴリ(日本語だと「入門」)を選択することでたくさん出てきます。
色々な練習問題に挑戦して基礎を固め、本番へ移行しましょう!

いよいよコンペに挑戦!

ある程度自信がついたらコンペに挑戦してみましょう。
メニューにあるCompeteをクリックすると、その時に開催されているコンペが出てくるので、気になるものを選んでみてください。

ちなみに、参加者が多いコンペは比較的初心者でも挑戦しやすいものであることが多いです。
したがって、上位入賞を目指すのではなくまずコードを書くことに慣れるという意味も兼ねて、初心者のうちはあえて参加者が多いものを狙ってみると良いでしょう。
Kaggleのコンペの中には景品や賞金が用意されているものも多数存在します。
ある程度自信がついてきたらこのようなコンペにも積極的に参加してみてください。

初心者におすすめのコンペを紹介!

練習用コンペはたくさん存在しますが、初心者に人気が高いものにはどんなものがあるのでしょうか。
そこで、初心者向けの練習用コンペをいくつかピックアップしました。
どんなコンペに参加するか迷った時は、とりあえずここで紹介したコンペに参加してみてください。

Titanic

日本でも映画『タイタニック』は不朽の名作として公開から時間が経過した現在でも愛されています。
そんなタイタニック号をテーマとしているのがこちらのコンペです。
初心者向けの練習用コンペとしてはトップクラスの人気を誇っており、Kaggleを始める人が最初に選ぶコンペとしても知られています。
こちらの内容はタイタニック号の乗客の生存率を予測するというものです。
定番であることから、インターネット上に解説が多く掲載されているというのもおすすめする理由の1つであり、万が一わからなくてもたくさん解説を読んで内容を理解できる状態を目指しましょう。

House Prices

House PricesはTitanicに並ぶ初心者向けの定番の練習問題です。
敷地面積や天井の高さなどといった情報から住宅の価格を予測するものであり、特に回帰分析関連のスキルを身に着けたい人におすすめの練習問題と言えます。
こちらもTitanic同様、日本語での解説がインターネット上にたくさん載っているので、わからない時は解説をたくさん読んで、解き方を理解し、再チャレンジしてみましょう。

Restaurant Revenue Prediction

Restaurant Revenue Predictionも初心者でも取り組みやすい練習問題として人気です。
レストランの売り上げを予測するものであり、House Pricesと同じ回帰分析の問題なので、House Pricesを解き終えた後に挑戦してみるのが良いでしょう。
ただ、こちらは過去に実際に開催されたコンペであり、先ほど紹介したコンペと違って順位が出ません。
ただ、スコアは出るので、すでに出ている順位をチェックして、ある程度の自分の位置を確認してください。

Digit Recognizer

こちらは画像解析の問題となります。
手書きの文字が書かれた画像を解析し、識別するモデルを構築します。
この技術は私生活で使うようなアプリにもよく導入される技術なので、趣味でプログラミングを学んでいる人も親しみやすい内容でしょう。
これまで紹介したコンペと比べると難易度は少し上がり、ニューラルネットワークやクラス分類などに関するスキルが身に付きます。

Getting startedに慣れてきたらPlaygroundに挑戦してみよう!

これまではGetting startedの例題を紹介してきましたが、古い問題が多く、ある程度経験を積んでくると物足りなく感じるでしょう。
Getting startedの次の段階としてPlaygroundという段階が用意されており、こちらは初心者向けでありながら、一部には賞金が発生するものもあります。
ただ、問題自体は競技プログラミングというよりもあくまで機械学習を楽しむための問題がメインとなっており、まだコンペに本格的に参加する自信がないならPlaygroundに挑戦してみるのがおすすめです。
ちなみにKaggleにはPlaygroundよりさらに上のFeatured・Researchや、就活に繋げられるRecruitmentなど上級者向けのコンテンツも用意されているので、自分のレベルに合わせて色々なコンペに参加してみてください。

たくさんコンペに参加して上位入賞を目指そう!


やはりKaggleに参加するメリットは上位入賞をすることで自分の機械学習エンジニアとしてのポジションが分かること、だんだんランキング上位に食い込めるようになってやりがいを感じられることでしょう。
そこでKaggleで上位入賞するためにはたくさん問題を解いて経験を積んでいくことが大切です。
積極的にコンペに参加し、上位入賞を目指しましょう。


参考になったら「いいね!」と「シェア」をお願いします!!

このエントリーをはてなブックマークに追加
AI(人工知能)セミナー開催中