구글 SRE 북 2판 공개: 10년의 운영 노하우가 바꾼 인프라의 미래
현대적 인프라 운영의 바이블로 불리는 구글 SRE 북의 개정판이 공개되며, 단순한 장애 복구를 넘어 AI 시대의 자동화와 신뢰성 공학의 새로운 기준을 제시합니다.
현대적 인프라 운영의 바이블로 불리는 구글 SRE 북의 개정판이 공개되며, 단순한 장애 복구를 넘어 AI 시대의 자동화와 신뢰성 공학의 새로운 기준을 제시합니다.
결정론적 시스템에서 확률적 AI 모델로의 전환은 기존의 SRE 패러다임을 완전히 파괴하며, 새로운 AI 신뢰성 공학(AIRE)으로의 진화를 요구하고 있습니다.
완벽한 가동률(Uptime)이라는 환상 뒤에 숨겨진 비용과 기술적 트레이드오프를 분석하며, 왜 현대의 거대 플랫폼이 100% 무중단 서비스보다 유연한 장애 대응에 집중하는지 살펴봅니다.
수천 대의 서버와 복잡한 마이크로서비스 환경에서 자동화가 가져오는 치명적인 리스크를 제어하고, 안전하게 시스템을 확장하는 넷플릭스의 엔지니어링 철학을 분석합니다.