Fault-tolerant design은 시스템의 일부 구성 요소에 오류나 결함이 발생하더라도 전체 시스템이 중단 없이 정상적으로 작동하도록 설계하는 방식을 의미하는 명사입니다. 주로 공학, 컴퓨터 과학, IT 인프라 분야에서 핵심적인 개념으로 사용되며, 시스템의 신뢰성과 가용성을 극대화하는 것이 목적입니다. 단순히 오류를 방지하는 것을 넘어, 오류가 발생했을 때 이를 감지하고 자동으로 복구하거나 우회하여 서비스의 연속성을 유지하는 능력을 강조합니다. 비슷한 개념인 'fail-safe'가 안전을 위해 시스템을 정지시키는 것에 초점을 맞춘다면, 'fault-tolerant'는 시스템을 계속 가동하는 것에 초점을 맞춘다는 점에서 차이가 있습니다. 비즈니스 환경에서는 서버 이중화나 데이터 백업 시스템 등을 설명할 때 자주 등장하며, 전문적이고 기술적인 문맥에서 주로 사용되는 용어입니다.