Sangmun

kaggle api 활용하기 본문

카테고리 없음

kaggle api 활용하기

상상2 2022. 6. 13. 19:56

요새 캐글을 열심히 하는 중인데 캐글에서 제공해주는 기본 커널을 사용할 때면 불편한 점이 한두 가지가 아니다.

특히 돌리는데 오래 걸리는 모델들은 커널에서 돌리는게 매우 비효율적이라는 것을 깨달았다.

 

1. kaggle package 설치

pip install kaggle

먼저 캐글 패키지를 설치해준다.

 

2. Authentication token 발급

오른쪽 상단의 계정 아이콘 -> Account -> Create New Api Token을 누르면 kaggle.json 파일이 다운로드된다.

3. kaggle json 파일 옮기기

다운로드한 kaggle.json 파일을 Linux, OSX 경우에는 아래 경로로

~/.kaggle/kaggle.json

 

Window의 경우에는 아래의 경로로 옮겨주면 된다.

C:\Users<Windows-username>.kaggle\kaggle.json

 

4. kaggle Competition 명령어

kaggle api를 사용하면서 가장 많이 사용하게 될 명령들이 아닌가 싶다. 

제출까지도 api로 가능한 점이 아마 가장 편리한 점이 아닌가 싶다.

 

* 진행 중인 Competition 불러오기

kaggle competitions list

 

*Competition 데이터 불러오기 ( Competition 정책에 대한 동의는 api로 불가능하다 직접 웹에서 동의를 해야 한다.. )

kaggle competitions download -c [COMPETITION]

 

* 제출하기

kaggle competitions submit -c [COMPETITION] -f [FILE] -m [MESSAGE]

 

5. 그 외

그 외에도 데이셋이나 api로  캐글 커널을 컨트로 할 수 있는 다양한 기능이 있다.

 

* 데이터 세트 다운로드

kaggle datasets download -d [DATASET

* 커널 생성 후 노트북 run 하기

kaggle kernels push -k [KERNEL] -p /path/to/kernel

 

이 처럼 캐글 api를 사용하는 법을 간단히 알아보았는데 그 외에도 캐글과 상호작용할 수 있는 더 많은 기능들이 kaggle api에 마련되어있다. (링크 참조)

 

https://www.kaggle.com/docs/api

 

Public API Documentation

Create Datasets, Notebooks, and connect with Kaggle

www.kaggle.com

https://github.com/Kaggle/kaggle-api#competitions

 

GitHub - Kaggle/kaggle-api: Official Kaggle API

Official Kaggle API. Contribute to Kaggle/kaggle-api development by creating an account on GitHub.

github.com

 

Comments