pimientitoの機械学習

「機械学習って何だろう。」から、はじまり、いまだ???の毎日。数学初心者、PG・DBアマチュアのサービス・エンジニアが、どこまで理解できるのか。

【前処理の学習-2】環境構築

今回は、これから機械学習を行うための環境作りを行います。

本橋智光氏著書の「前処理大全 データ分析のためのSQL/R/Python 実践テクニック」(技術評論社)のなかでは、3つのプログラミング言語を挙げており、前処理の各場面によって使い分けるとのことです。

なお事前準備として、各言語や開発環境などの各種設定を行いますが、インストール手順などは、機械学習を「学習」することから少々逸れてしまうため、割愛させていただきます。

また本橋氏は著書のなかで、SQL(Database)については、BigQuery(Google)やRedshift(Amazon)を挙げられていらっしゃいますが、超初心者である自分は、機械学習「外」の操作や設定などで悩むことを避けるため、いったんPostgreSQLを選択いたしました。

今後、学習を進めるなかで、前述のDatabaseの機能が必要となったとき、あらためて導入することといたします。

今回の機械学習で使用する環境は、以下の通りです。

【環境】

【言語/開発環境】※Pythonを除き、各言語のバージョンは明記しておりません。

今回は、以上です。




【更新履歴】 2018.07.13 タイトル【前処理の学習】にインデクスを追加しました。