본문 바로가기

DATA SCIENCE/Study

머신러닝 관련 기초지식 : epoch / batch_size / iteration / dataset

# 머신러닝 관련

 

batch_size/iteration/epoch와의 관계

 

1,000개의 데이터로 이루어진 데이터셋이 있다고 했을 때

이를 100개의 batch_size로 묶는다면

10번의 iteration이 일어나야 한 번의 epoch가 가능.

 

사전적으로 epoch는 모든 데이터셋이 학습에 사용되었는지를 따지는 것이고, 

iteration은 하나의 epoch 안에서 지정된 batch_size별로 한 번의 데이터셋이 몇 번의 사이클을 통해 완성되었는지를 따지게 된다.

 

따라서 

 

1 epoch : iteration * batch_size = Amounts of Data

 

라고 할 수 있으며,

 

만약 배치 사이즈를 1,000개의 데이터와 같은 숫자인 1,000으로 지정한다면,

iteration과 epoch는 같아지게 된다.