본문 바로가기
Boostcamp AI Tech/[week 1-5] LEVEL 1

[Week 4 - Day 1] Pstage 이미지 분류 - EDA

by newnu 2021. 8. 24.
반응형

Machine learning flow (Competition)

Domain understanding - Data Mining - Data Analysis - Data Processing - Modeling - Training - Deploy

 

EDA(Exploratory Data Analysis)

탐색적 데이터 분석

 

Image Classification

이미지 - (width, height, channel)

 

Image Classification & EDA

1. Data Statistics

- 전체 이미지에 대해서 이미지 개수, 크기, RGB값의 평균과 표준편차 계산

- 객체 위치 확인

- y 값 분석

   - 메타 데이터 분석

   - 성별, 연령 분포 확인

- X,y 관계 확인

- 데이터 노이즈 확인 ( 라벨링 잘못 되어 있는 경우,..)

 

PIL(Python Image Library)

pillow 모듈

from PIL import Image
image = Image.open(image_path)

 

torchvision.transforms

from torchvision import transforms

transform = transforms.Compose([Resize(resize,Image.BILINEAR), 
                                ToTensor(),
                                Normalize(mean = mean,std = std),
                                ])

Compose : 여러 transforms들을 하나로 묶어서 처리

Resize() : 이미지 사이즈 변환

To Tensor() : PIL 이미지나 numpy ndarray를 텐서로 변환

Normalize():  정규화

 

ToPILImage() : 이미지를 array로 불러오기

im_arr = torch.rand((3, 224, 224))  # cv.imread나 plt.imread 와 같은 함수와 같이 쓰임
im_pil = transforms.ToPILImage()(im_arr)

 

np.clip(array,min,max)

: min 값 보다 작은 값들을 min값으로, max 값 보다 큰 값들을 max값으로 바꿔주는 함수

 

torch.clamp(input,min,max)

: min 값 보다 작은 값들을 min값으로, max 값 보다 큰 값들을 max값으로 바꿔주는 함수

반응형