kaggle _ 캐글 Colaboratory_코랩 연동 하기(노트북 용량 없을때 꿀팁)
본문 바로가기
데이터과학자가 될 수 있을까?/정보공유

kaggle _ 캐글 Colaboratory_코랩 연동 하기(노트북 용량 없을때 꿀팁)

by 데이터과학자 이한 2024. 1. 25.

안녕하세요 이한입니다!

 

캐글이랑 코랩이 연동이 된다는 사실을 알고 있으신가요?

 

저는 캐글과 코랩을 연동해서 사용하고 있었는데요 때마침 새로운 프로젝트를 시작할 예정이라 연동하는 과정을

보여드릴 수 있을것 같습니다.! 

 

순서대로 보여드리도록 하겠습니다.! 

 

1.캐글 로그인 

 

캐글 로그인이 하셨다면 오른쪽 상단의 오리 모양을 눌러주세요

Settings 창을 누르면 

 

api Token을 받을 수 있습니다. 

 

 

앞전에 사용한 토큰이 있다면 Expire Token을 통해 삭제도 괜찮습니다.

 

다운을 받으면 이렇게 파일을 받게 됩니다.

 

 

그럼 이제  코랩을 로그인해줄게요

 

2.코랩 로그인

 

마운틴은 필수로 해주세요 아니면 데이터가 없어진답니다. 

마운틴 하는 방법은 아래에 들어가면 확인이 가능합니다. 

 

 

https://2han.co.kr/entry/%EC%BD%94%EB%9E%A9%EC%97%90%EC%84%9C-zip-%ED%8C%8C%EC%9D%BC-%ED%92%80%EA%B8%B0

 

코랩에서 zip 파일 풀기

안녕하세요 이한입니다! 저는 D드라이브 용량이 없는 편인데요. 이번에 받은 zip 파일을 풀려고 하니 드라이브 용량을 늘려야 된다고 해서 코랩에서 zip 파일을 푸는 방법을 소개해 드리려고 합니

2han.co.kr

 

 

3. 마운틴까지 끝이 났다면

 

from google.colab import files

files.upload()  # 여기서 다운로드한 kaggle.json 파일을 선택합니다.

 

이렇게 파일선택을 통해 다운로드 된 파일을 올려주시고 

아래에 성공했다는 메세지를 받을 수 있습니다.

 

 

앞에 kaggle api를 이미 받아서 kaggle(1) 이런식으로 다운이 되었다면 앞 토큰을 삭제 하고 새로받은 api를 kaggle로 수정해서 사용하는 것이 편합니다.!

 

 

4.캐글 API를 설정해 주세요

 

!mkdir ~/.kaggle  # kaggle 디렉토리 생성
!cp kaggle.json ~/.kaggle/  # kaggle.json 파일을 kaggle 디렉토리로 복사
!chmod 600 ~/.kaggle/kaggle.json  # 권한 설정

 

 

 

저는 잘 진행이 되었습니다.

 

5.데이터셋

!kaggle datasets download -d [데이터셋 이름]  # 예: 'zynicide/wine-reviews'

이렇게도 되지만

 

저는 캐글에서 Data에 들어가 데이터를 다운 받는 코드를 복사해서 사용하도록 하겠습니다.

 

 

 

 

잘 진행이 되어가네요

 

 

 

이렇게 다운 받은 파일은 앞서 zip풀기를 통해 저의 구글 드라이브에 바로 저장이 가능하게 됩니다.

저는 용량이 없기에 이렇게 사용하게 되었습니다.

 

용량이 없는 분들을 위해  다음에는 캐글 노트북에서 사용하는 방법을 알려 드리도록 하겠습니다.

 

 

파일을 원하는 경로에 풀어보도록 하겠습니다.

!unzip my_dataset.zip -d my_data # my_dataset.zip에 원하는 zip 일을 -d 이후로 my_data에는 원하는 폴더 경로를 설정해 주세요

 

 

구글 드라이브에서 확인해 보겠습니다.

네! 잘 다운이 받아지고 있네요

 

 

이렇게 하면 컴퓨터 드라이버를 사용하지 않고 사용이 가능합니다.!

 

 

 

 


TOP

Designed by 티스토리