Machine learning flow (Competition)
Domain understanding - Data Mining - Data Analysis - Data Processing - Modeling - Training - Deploy
EDA(Exploratory Data Analysis)
탐색적 데이터 분석
Image Classification
이미지 - (width, height, channel)
Image Classification & EDA
1. Data Statistics
- 전체 이미지에 대해서 이미지 개수, 크기, RGB값의 평균과 표준편차 계산
- 객체 위치 확인
- y 값 분석
- 메타 데이터 분석
- 성별, 연령 분포 확인
- X,y 관계 확인
- 데이터 노이즈 확인 ( 라벨링 잘못 되어 있는 경우,..)
PIL(Python Image Library)
pillow 모듈
from PIL import Image
image = Image.open(image_path)
torchvision.transforms
from torchvision import transforms
transform = transforms.Compose([Resize(resize,Image.BILINEAR),
ToTensor(),
Normalize(mean = mean,std = std),
])
Compose : 여러 transforms들을 하나로 묶어서 처리
Resize() : 이미지 사이즈 변환
To Tensor() : PIL 이미지나 numpy ndarray를 텐서로 변환
Normalize(): 정규화
ToPILImage() : 이미지를 array로 불러오기
im_arr = torch.rand((3, 224, 224)) # cv.imread나 plt.imread 와 같은 함수와 같이 쓰임
im_pil = transforms.ToPILImage()(im_arr)
np.clip(array,min,max)
: min 값 보다 작은 값들을 min값으로, max 값 보다 큰 값들을 max값으로 바꿔주는 함수
torch.clamp(input,min,max)
: min 값 보다 작은 값들을 min값으로, max 값 보다 큰 값들을 max값으로 바꿔주는 함수
'Boostcamp AI Tech > [week 1-5] LEVEL 1' 카테고리의 다른 글
[Week 4 - Day 3] Pstage 이미지 분류 - Model (0) | 2021.08.25 |
---|---|
[Week 4 - Day 2] Pstage 이미지 분류 - Data Generation (0) | 2021.08.24 |
[Week 3 - Day 4 ] Pytorch (0) | 2021.08.20 |
[Week 3 - Day 3 ] Pytorch (0) | 2021.08.20 |
[Week 3 - Day 2 ] Pytorch (0) | 2021.08.20 |