Exploratory Data Analysis(EDA)는 데이터를 본격적으로 분석하기 전에 데이터의 특징을 파악하고 구조를 이해하기 위해 수행하는 초기 분석 과정을 의미합니다. 통계학자 존 터키(John Tukey)가 제안한 개념으로, 수치적인 요약이나 시각화 도구를 사용하여 데이터의 패턴을 찾고, 이상치(outlier)를 발견하며, 가설을 세우는 데 중점을 둡니다. 이는 단순히 가설을 검정하는 '확증적 데이터 분석(CDA)'과는 대조되는 개념으로, 데이터가 가진 본연의 이야기를 듣는 과정이라 할 수 있습니다. 데이터 과학이나 통계 분야에서 매우 필수적인 단계이며, 분석의 방향성을 결정짓는 중요한 역할을 합니다. 전문적인 학술 용어이면서도 실무 데이터 분석 현장에서 매우 빈번하게 사용되는 표현입니다. 데이터의 분포를 살피고 변수 간의 관계를 시각적으로 확인하는 모든 행위가 이 범주에 포함됩니다.