機械学習を学ぶためのPythonを活用した学習教材の開発

高等学校や中学校の授業で機械学習を学ぶための教育プログラムを開発しました。

データサイエンスとは、データを分析・活用して、新たな価値を見つけ出す試みです。

例えば、売上に関連するデータを分析・活用して、未来の売上個数を予測する、売上を増やすために、お店はどのようなことをすればよいかなどを考察することが挙げられます。

データサイエンスが注目をされるようになった背景として、近年の情報化社会の発達により、多様なデータ、すなわちビッグデータを収集することが可能になったこと、そして、それらを分析するコンピューターの性能の向上、そして、インターネットをはじめとするネットワークを活用により、データのやり取りを効率的に行えるようになったことがあります。

データサイエンスは、単にデータを集計して、表やグラフにするだけではなく、それらを統計的性質（平均や分散）を求め、さらに、未来を予測するといった機械学習といった手法があります。本教育プログラムで開発した教材は、この機械学習の基礎を学ぶことを目標としました。

機械学習の種類には、教師あり学習、教師なし学習、強化学習などがあります。教師あり学習は、予め答えがあるもの（教師データ）に対して予測などを行うもので、回帰、分類といった手法があります。また、教師なし学習は、予め答えがないものに対してグループ化や変数変換などを行うもので、クラスタリングや次元削減といった手法があります。

今回の教育プログラムでは、Google Colaboratoryで動作する体験型教材としました。Google Colaboratoryは、Webブラウザ上でプログラミングを行うことができるアプリです。これまでプログラミングを始める際は、コンピューターへプログラミング言語をインストールし、その後、初期設定をするなど準備が大変でしたが、Google Colaboratoryであれば、Googleアカウントとインターネットへの接続環境があれば、簡単にプログラミングを始めることができます。今回作成した教材は、アプリURL（https://ocha-algo.com/）から利用することができます。
（Google Colaboratoryを利用するため、GoogleアカウントとGoogle Colaboratoryの導入が必要になります。Google Colaboratoryの導入方法は、以下を参照してください。）

Google Colaboratoryの導入方法

まず、Google ChromeからGoogleドライブにアクセスし、以下の画面のように、「その他」の中にGoogle Colaboratoryがあるか確認してください。あればそれをクリックし、なければ、「アプリを追加」をクリックし、Colaboratoryを追加してください。

追加した場合は、以下のような画面が表示されることがあります。その場合は、一度ウィンドウを閉じて、再度Googleドライブにアクセスします。すると、今度は、Google Colaboratoryがあるので、クリックしてください。

Google Colaboratoryの動作確認

Google Colaboratoryの動かし方を確認しましょう。
Google Colaboratoryを起動すると、以下のような画面になっていると思います。

この灰色の部分を「セル」と言います。このセルの中に、以下に半角英数で以下のように入力し、Shiftキーを押しながらEnterキーを押してみましょう。

すると、その下に、「2」と表示され、さらに、新しいセルが表示されます。このようにしてプログラムを順番に実行していきます。
上記を含めて、いくつかのサンプルを用意したので、順番に実行してみてください（「警告: このノートブックは Google が作成したものではありません。」と表示されることがあります。これは、Google以外の人が作成したファイルを実行する場合、最初のみ表示されます。プログラムを実行したい場合は、「このまま実行」をクリックしてください）。