深層学習とその他

機械学習したいマン

kaggle-apiを使ってdownload, submitを行う

アドベントカレンダー22日目です。
今日はkaggle-apiの使い方を書いていきたいと思います。 adventar.org

リモートで出力されたcsvをいちいちダウンロードしてsubmitするのは面倒ですよね。 コンペのファイルをダウンロードするのも面倒ですね。

そういうときはkaggle-apiが便利です。

** インストール

インストールもお手軽にpipでできます。

pip install kaggle

セットアップ

使用前にtokenを設定する必要があります。

  1. kaggleのサイトを開き、アカウント設定を開きます。http://kaggle.com/f:id:looseleaf0727:20180628144134p:plain

  2. Create API Tokenからjsonを取得します。f:id:looseleaf0727:20180628144842p:plain

  3. ダウンロードしたjsonを決まった位置に配置します。 ~/.kaggle/kaggle.json

  4. 権限を設定します。
    chmod 600 ~/.kaggle/kaggle.json

使い方

データをダウンロードする

quoraコンペの例ではこのようになります。
`kaggle competitions download -c quora-insincere-questions-classification
これを打ち込むだけで、デフォルトの位置にダウンロードされます。 f:id:looseleaf0727:20181222102145j:plain

submitする

提出するファイルを-fの後に指定し、提出する際のメッセージを-m以降で設定できます。 kaggle competitions submit -c ga-customer-revenue-prediction -f submission.csv -m "Message"

f:id:looseleaf0727:20181222102201j:plain

まとめ

毎回submitする際にCSVをダウンロードしたりしなくてすむので、ぜひ使ってみてください。