Test-set은 주로 머신러닝, 통계학, 소프트웨어 공학 분야에서 모델의 성능을 최종적으로 평가하기 위해 사용하는 데이터 집합을 의미합니다. 모델을 학습시킬 때 사용하지 않고 따로 떼어둔 데이터로, 모델이 처음 보는 새로운 데이터에 대해 얼마나 정확하게 예측하는지를 객관적으로 측정하는 척도가 됩니다. 흔히 학습용 데이터인 training set과 대비되어 사용되며, 모델이 학습 데이터에만 과도하게 맞춰지는 과적합(overfitting) 현상을 방지하고 모델의 일반화 성능을 확인하는 데 필수적입니다. 일반적인 일상 대화보다는 기술적인 문맥이나 데이터 분석 프로젝트에서 자주 등장하는 전문 용어입니다. 유사한 개념으로 validation set이 있는데, validation set은 모델의 하이퍼파라미터를 튜닝하는 과정에서 사용되는 반면, test-set은 모든 학습과 튜닝이 끝난 후 최종 성능을 확인하는 용도로만 사용된다는 점에서 차이가 있습니다.