pimientitoの機械学習

「機械学習って何だろう。」から、はじまり、いまだ???の毎日。数学初心者、PG・DBアマチュアのサービス・エンジニアが、どこまで理解できるのか。

【前処理の学習-6】データ読込み~下準備(Windows環境編)①~

前回、Shift-JIS形式のデータファイルをUTF-8形式へ変更することで、正常にjupyter notebookへ読込むことができました。 pimientito-handson-ml.hatenablog.com しかし同時に、これより先に進むためには、まだ何点か課題をクリアする必要があることも分かり…

【前処理の学習-5】データ読込み~事前確認②~

前々回【前処理の学習-3】では、読込んだデータが文字化けしたことで頓挫したデータ読込み。いったん文字コード・改行コードについて見直し、あらためてデータ読込みに挑戦いたします。 データ分析は本業ではないためセオリーを分かっておらず、どのように進…

【前処理の学習-4】文字コード・改行コードについて

前回「【前処理の学習】データ読込み~事前確認①~」の後半、mac環境のjupyter notebookでデータファイルを読込むと文字化けしてしまうことが分かりました。 pimientito-handson-ml.hatenablog.com 今回はいったんデータ読込みから離れて文字コードや改行コ…

【前処理の学習-3】データ読込み~事前確認①~

今回は、各言語(SQL/R/Python)でデータの読込みを行いたいと思います。 はじめに今回使用するデータについて簡単にご説明いたします。 (財)気象業務支援センター発行の「地上気象観測時日別編集データ(CSV版)2000年」を使用いたします。 CD-ROM内に収…

【前処理の学習-2】環境構築

今回は、これから機械学習を行うための環境作りを行います。 本橋智光氏著書の「前処理大全 データ分析のためのSQL/R/Python 実践テクニック」(技術評論社)のなかでは、3つのプログラミング言語を挙げており、前処理の各場面によって使い分けるとのことで…

【前処理の学習-1】主な参考資料とサンプルデータについて

残念ながら資料を一切使わずにお話しを進めることができないため、学習を始める前に参考にさせて頂く書籍等をご紹介させて頂きます。 前処理の学習資料は、本橋智光氏著作の「前処理大全 データ分析のためのSQL/R/Python実践テクニック」(技術評論社)を中…

はじめに

ほんの些細なことからはじめた機械学習。 関連書籍を何冊購入しても、サンプルプログラムを写経しても、いまひとつ要領を得ない日々。 ついつい華やかで難しい数式やアルゴリズムに目を奪われてしまいますが、あらためて考えてみると、競技プログラミングの…