Published on2026년 1월 31일Jenkins 에이전트 오프라인·대기열 지옥 탈출aiJenkins 에이전트가 오프라인이거나 빌드가 대기열에서 멈출 때, 원인 분류부터 로그·네트워크·Kubernetes·인증서·리소스까지 단계별로 복구하는 실전 가이드입니다.Read more →
Published on2026년 1월 31일KServe+Knative로 GPU 모델 자동스케일 배포aiKServe와 Knative를 조합해 GPU 추론 서비스를 요청 기반으로 자동 확장하고, 유휴 시 0으로 스케일 다운하는 배포 패턴을 정리합니다. 실제 운영에서 자주 겪는 콜드스타트, 동시성, GPU 스케줄링 함정까지 함께 다룹니다.Read more →
Published on2026년 1월 31일KServe+Knative로 GPU 모델 무중단 카나리 배포aiKServe InferenceService를 Knative 트래픽 스플리팅과 결합해 GPU 모델을 무중단으로 카나리 배포하는 방법을 정리합니다. 준비 체크리스트부터 YAML 예제, 관측·롤백·운영 함정까지 실전 기준으로 설명합니다.Read more →
Published on2026년 1월 31일KServe vLLM 배포 503·HPA 미작동 원인 7가지aiKServe 위에 vLLM을 올렸을 때 503이 터지거나 HPA가 전혀 스케일링하지 않는 문제는 대개 트래픽 라우팅, 프로브, 메트릭 파이프라인, 리소스 설계의 작은 불일치에서 시작됩니다. 현장에서 자주 밟는 7가지 원인과 재현·진단·해결 체크리스트를 정리합니다.Read more →
Published on2026년 1월 31일Kubernetes HPA가 0으로 안 줄 때 - PDB·윈도우·종료techHPA가 minReplicas=0인데도 0으로 내려가지 않는 대표 원인(PDB, stabilizationWindowSeconds, 종료 지연, 메트릭/스케일다운 정책)을 재현 가능한 체크리스트로 정리합니다.Read more →