Published on2026년 1월 31일systemd 서비스 자동 재시작 - 죽었다 깨도 복구syntaxsystemd의 Restart 정책과 watchdog, 백오프, 헬스체크 스크립트를 조합해 서비스가 어떤 형태로 죽어도 자동 복구되도록 구성합니다. 장애 루프를 막는 제한과 관측(journalctl)까지 함께 정리합니다.Read more →
Published on2026년 1월 30일Argo CD Sync 실패? RBAC·CRD·Drift 진단법syntaxArgo CD Sync가 실패할 때 가장 흔한 원인인 RBAC, CRD 누락, Drift를 빠르게 분류하고 재현·검증하는 실전 진단 절차를 정리합니다.Read more →
Published on2026년 1월 30일리눅스 OOM Killer로 프로세스 죽을 때 진단법tech프로세스가 갑자기 죽고 로그에 OOM 흔적만 남는다면, dmesg·cgroup 메모리 제한·ulimit까지 한 번에 점검해야 합니다. 커널 OOM 로그 해석부터 컨테이너/서비스 단위 원인 규명, 재발 방지 설정까지 실전 절차로 정리합니다.Read more →
Published on2026년 1월 30일OpenAI 429 RateLimit 재시도·백오프 구현 가이드aiOpenAI API에서 429 RateLimit을 만났을 때 안전하게 재시도하는 백오프·지터·동시성 제어 패턴을 정리합니다. Node.js와 Spring Boot 예제로 운영에 바로 적용할 수 있는 구현을 제공합니다.Read more →
Published on2026년 1월 29일Ollama 로컬 LLM이 GPU를 안 쓰는 이유 9가지aiOllama를 설치했는데도 추론이 CPU만 쓰는 경우가 흔합니다. GPU 미사용의 대표 원인 9가지를 OS/드라이버/빌드/모델/런타임 관점에서 빠르게 진단하는 체크리스트를 정리합니다.Read more →