Fault-tolerant system은 시스템의 일부 구성 요소에 결함이나 오류가 발생하더라도 전체 시스템이 중단되지 않고 정상적으로 작동을 계속할 수 있도록 설계된 컴퓨터 시스템을 의미합니다. 주로 IT, 공학, 항공 우주 분야에서 시스템의 신뢰성과 가용성을 보장하기 위해 사용되는 전문 용어입니다. 일반적인 시스템이 오류 발생 시 즉시 멈추는 것과 달리, 이 시스템은 중복 설계나 자동 복구 메커니즘을 통해 서비스의 연속성을 유지합니다. 'Fault'는 결함이나 오류를, 'Tolerant'는 관대한 또는 견딜 수 있는이라는 뜻을 가지고 있어, 결함이 발생해도 이를 용인하고 견뎌내어 시스템이 죽지 않게 만든다는 의미를 내포합니다. 비즈니스 환경에서는 서버의 안정성을 강조할 때 자주 등장하며, 단순히 오류가 없는 시스템이 아니라 오류가 발생해도 멈추지 않는 회복 탄력성이 높은 시스템을 지칭할 때 사용합니다.