import gdown, zipfile
import os, glob, shutil
from tqdm import tqdm
import os.path
내 구글 드라이브 연동하기
from google.colab import drive
drive.mount('/content/drive')
데이터 다운로드
def download_file(file_id, save_path) :
if os.path.exists(save_path) :
print(f'{save_path} 파일이 이미 존재합니다.')
return
gdown.download(id=file_id, output=save_path, quiet=False)
구글 공유 id를 통해 zip파일 불러오기
file_id = '1JHo4Rsb8Mx-sJqu7xdQWUgrfAf3H1g7W'
download_file(file_id, 'car_images.zip')
zip 파일 압축 해제
def dataset_extract(file_name) :
with zipfile.ZipFile(file_name, 'r') as zip_ref :
file_list = zip_ref.namelist()
if os.path.exists(f'/content/{file_name[-14:-4]}/') :
print(f'데이터셋 폴더가 이미 존재합니다.')
return
else :
for f in tqdm(file_list, desc='Extracting', unit='files') :
zip_ref.extract(member=f, path=f'/content/{file_name[-14:-4]}/')
dataset_extract('/content/car_images.zip')
데이터 조회
# 폴더별 이미지 데이터 갯수 확인
folder_path = '/content/car_images/abnormal'
folder_path2 = '/content/car_images/normal'
ab_files = glob.glob(folder_path + '/*')
normal_files = glob.glob(folder_path2 + '/*')
from pathlib import Path
dir_ = Path('/content/car_images')
filepaths = list(dir_.glob(r'**/*.png'))