データ分析

データ分析で役立つpythonテンプレートまとめ

kaggleなどのデータ分析で忘れがちなpythonコードを使用する段階ごとにまとめておきます
jupyter notebookの使用を想定しています

はじめ

定番モジュールの読み込み

訓練データを読み込み、データサイズと先頭行を把握

avatar
元々のデータの左端に0,1,2...のindexが書かれている場合は、index_col=0にしないと、0,1,2..のindexが重複してしまうよ♪

テストデータを読み込み、データサイズと先頭行を把握

データの値を観察

全体に注目

統計量

他のカラムに注目

統計量

 グラフで図示

データの加工

ラベルエンコーディングとone-hotエンコーディング

 

 

スポンサーリンク



スポンサーリンク



-データ分析

Copyright © Puccho , All Rights Reserved