테스트 코드에 'sleep'을 넣고 계신가요? 비동기 테스트의 치명적 실수

무분별한 Thread.sleep() 사용이 어떻게 CI/CD 파이프라인을 느리게 만들고 테스트 신뢰도를 떨어뜨리는지 분석하고, 이를 대체할 효율적인 비동기 대기 전략을 제시합니다.

현대의 소프트웨어 아키텍처는 대부분 비동기(Asynchronous) 방식으로 동작합니다. API 호출, 데이터베이스 쿼리, 메시지 큐 처리 등 우리가 작성하는 대부분의 핵심 로직은 ‘결과가 즉시 나오지 않는’ 특성을 가집니다. 개발자들은 이 비동기 로직을 테스트하기 위해 아주 쉽고 직관적인 방법을 선택하곤 합니다. 바로 sleep() 함수를 사용하여 일정 시간 동안 실행을 멈추는 것입니다.

하지만 이 단순한 선택이 프로젝트가 커질수록 거대한 기술 부채로 돌아옵니다. 테스트 코드 곳곳에 흩어진 ‘마법의 숫자’들(예: 2초 대기, 5초 대기)은 테스트 실행 시간을 기하급수적으로 늘릴 뿐만 아니라, 때로는 환경에 따라 간헐적으로 실패하는 ‘플래키 테스트(Flaky Tests)’의 주범이 됩니다. 우리는 왜 비동기 테스트에서 sleep을 제거해야 하며, 그 대안은 무엇인지 깊이 있게 살펴봐야 합니다.

왜 sleep()은 최악의 선택인가

비동기 테스트에서 Thread.sleep()이나 await asyncio.sleep() 같은 정적 대기 시간을 사용하는 것은 기본적으로 ‘추측’에 기반한 테스트 방식입니다. 개발자는 “이 작업은 보통 1초 안에 끝나니까 2초 정도 기다리면 안전하겠지”라고 가정합니다. 하지만 이 가정에는 치명적인 두 가지 결함이 있습니다.

시간 낭비의 누적: 단일 테스트에서 2초의 sleep은 짧게 느껴질 수 있습니다. 하지만 테스트 케이스가 1,000개로 늘어나고, 각 테스트마다 이런 대기 시간이 포함된다면 전체 빌드 시간은 수십 분으로 늘어납니다. 이는 개발자의 피드백 루프를 늦추고 CI/CD 파이프라인의 효율성을 완전히 파괴합니다.
불확실한 신뢰성: 로컬 환경에서는 2초면 충분했을 작업이, 리소스가 제한된 CI 서버나 네트워크 지연이 발생하는 환경에서는 3초가 걸릴 수 있습니다. 이 경우 코드는 정상임에도 불구하고 테스트는 실패합니다. 반대로 작업이 0.1초 만에 끝났음에도 불구하고 무조건 2초를 기다려야 하므로 불필요한 자원 낭비가 발생합니다.

정적 대기를 대체하는 ‘폴링(Polling)’ 전략

가장 효과적인 해결책은 ‘정해진 시간 동안 기다리는 것’이 아니라 ‘원하는 상태가 될 때까지 확인하는 것’입니다. 이를 폴링(Polling) 방식이라고 합니다. 폴링은 특정 조건이 충족되었는지 짧은 간격으로 반복해서 확인하고, 조건이 충족되는 즉시 다음 단계로 넘어가는 방식입니다.

예를 들어, 사용자가 버튼을 클릭한 후 화면에 ‘완료’ 메시지가 나타나는지 테스트한다고 가정해 보겠습니다. sleep(5000)을 사용하는 대신, “최대 5초 동안 0.1초 간격으로 ‘완료’ 메시지가 나타났는지 확인하라”는 로직을 구현하는 것입니다. 이렇게 하면 메시지가 0.2초 만에 나타났을 때 테스트는 즉시 성공하며, 전체 실행 시간을 획기적으로 줄일 수 있습니다.

실무 적용: 도구와 구현 방법

대부분의 현대적인 테스트 프레임워크는 이러한 폴링 메커니즘을 내장하고 있습니다. 직접 루프를 구현하기보다 검증된 라이브러리를 사용하는 것이 안전합니다.

Java/Kotlin (Awaitility): Awaitility는 비동기 시스템 테스트를 위한 표준 라이브러리입니다. await().atMost(5, SECONDS).until(() -> service.isCompleted());와 같은 가독성 높은 DSL을 제공하여 복잡한 대기 로직을 단순화합니다.
JavaScript/TypeScript (Testing Library): findBy* 쿼리는 내부적으로 폴링을 수행합니다. 요소가 DOM에 나타날 때까지 기본적으로 일정 시간 동안 기다리며, 나타나는 즉시 테스트를 진행합니다.
Python (tenacity): 재시도 로직을 구현하는 tenacity 라이브러리를 통해 특정 조건이 만족될 때까지 함수 실행을 반복하도록 설정할 수 있습니다.

비동기 테스트 전략 비교

정적 대기와 동적 대기(폴링)의 차이를 명확히 이해하기 위해 아래 표를 참고하십시오.

구분	정적 대기 (sleep)	동적 대기 (Polling/Await)
실행 시간	항상 설정된 최대 시간 소요	조건 충족 즉시 종료 (최적화됨)
안정성	환경 변화에 취약 (Flaky)	타임아웃 범위 내에서 매우 안정적
코드 가독성	단순하지만 의도가 불분명함	“무엇을 기다리는지” 명확히 명시됨
CI/CD 영향	빌드 시간 증가의 주원인	빠른 피드백 루프 유지 가능

더 높은 수준의 해결책: 가상 시간과 콜백

폴링조차도 결국 실제 시간을 소비한다는 점에서 완벽한 정답은 아닙니다. 더 고도화된 테스트를 위해서는 ‘시간’ 자체를 제어하는 전략이 필요합니다.

첫째, 가상 시간(Virtual Time)을 사용하는 것입니다. JavaScript의 Jest나 Sinon.js 같은 도구는 useFakeTimers() 기능을 제공합니다. 이를 통해 10초 뒤에 실행될 타이머를 즉시 실행되도록 ‘시간을 점프’시킬 수 있습니다. 실제 물리적 시간을 기다리지 않고도 시간 기반 로직을 완벽하게 검증할 수 있는 방법입니다.

둘째, 이벤트 기반 알림(Callback/Promise)을 활용하는 것입니다. 테스트 대상 코드에 특정 이벤트가 발생했을 때 신호를 보내는 훅(Hook)을 추가하거나, Promise/Future 객체를 반환하게 하여 해당 객체가 resolve될 때까지 대기하는 방식입니다. 이는 추측을 완전히 제거하고 결정론적인(Deterministic) 테스트를 가능하게 합니다.

지금 당장 실천해야 할 액션 아이템

비동기 테스트의 늪에서 벗어나기 위해 실무자가 지금 바로 적용할 수 있는 단계별 가이드를 제시합니다.

코드베이스 전수 조사: 프로젝트 전체 코드에서 sleep, delay, wait 키워드를 검색하십시오. 특히 테스트 폴더 내에 존재하는 정적 대기 시간을 모두 찾아내어 목록화하십시오.
우선순위 선정 및 교체: 가장 자주 실행되는 테스트나, 가장 빈번하게 실패하는(Flaky) 테스트부터 폴링 라이브러리(Awaitility, Testing Library 등)로 교체하십시오.
타임아웃 표준화: 무작정 긴 시간을 설정하지 말고, 시스템의 최대 허용 응답 시간을 기준으로 표준 타임아웃 정책을 수립하십시오. (예: 내부 API는 최대 3초, 외부 연동은 최대 10초)
코드 리뷰 규칙 추가: 앞으로 작성되는 테스트 코드에 정적 sleep()이 포함될 경우, 반드시 그 이유를 소명하거나 동적 대기 방식으로 수정하도록 리뷰 가이드라인에 명시하십시오.

결국 좋은 테스트란 단순히 ‘통과하는 테스트’가 아니라, ‘빠르고 정확하게 실패를 알려주는 테스트’입니다. 비동기 테스트에서 sleep을 제거하는 것은 단순한 코드 최적화를 넘어, 개발 팀의 생산성과 제품의 신뢰도를 높이는 가장 확실한 투자입니다.

FAQ

Stop Sleeping ThroughYour Async Tests의 핵심 쟁점은 무엇인가요?

핵심 문제 정의, 비용 구조, 실제 적용 방법, 리스크를 함께 봐야 합니다.

Stop Sleeping ThroughYour Async Tests를 바로 도입해도 되나요?

작은 범위에서 실험하고 데이터를 확인한 뒤 단계적으로 확대하는 편이 안전합니다.

실무에서 가장 먼저 확인할 것은 무엇인가요?

목표 지표, 대상 사용자, 예산 범위, 운영 책임자를 먼저 명확히 해야 합니다.

법률이나 정책 이슈도 함께 봐야 하나요?

네. 데이터 수집 방식, 플랫폼 정책, 개인정보 관련 제한을 반드시 점검해야 합니다.

성과를 어떻게 측정하면 좋나요?

비용, 전환율, 클릭률, 운영 공수, 재사용 가능성 같은 지표를 함께 보는 것이 좋습니다.

지금 바로 시작할 수 있는 실무 액션

현재 팀의 AI 활용 범위와 검증 절차를 먼저 문서화합니다.
작은 파일럿 프로젝트로 KPI를 정하고 2~4주 단위로 검증합니다.
보안, 품질, 리뷰 기준을 자동화 도구와 함께 연결합니다.

테스트 코드에 ‘sleep’을 넣고 계신가요? 비동기 테스트의 치명적 실수