Published on2026년 1월 18일KServe LLM 503 해결 - autoscaling·readiness 진단aiKServe에서 LLM 추론 중 503이 발생할 때, 대다수 원인은 오토스케일링 지연과 readiness 판정 불일치입니다. Knative/KPA·HPA 설정, 프로브, 큐 프록시 지표로 원인을 빠르게 좁히는 실전 진단 절차를 정리합니다.Read more →
Published on2026년 1월 18일리눅스 cron 미실행 원인 12가지 체크리스트aicron이 실행되지 않을 때 가장 흔한 12가지 원인을 빠르게 배제하는 체크리스트입니다. 로그 확인부터 환경변수·권한·systemd 상태까지 재현 가능한 진단 순서로 정리합니다.Read more →
Published on2026년 1월 18일LLM SSE 스트리밍 499 502 급증과 응답 끊김을 잡는 프록시 튜닝 체크리스트aiLLM 스트리밍(SSE)에서 499/502가 늘고 응답이 끊길 때, Nginx/Envoy의 버퍼링·idle_timeout·HTTP/2 설정을 점검해 TTFB와 중단률을 동시에 낮추는 실전 체크리스트를 정리합니다.Read more →
Published on2026년 1월 18일Milvus HNSW 튜닝 - recall 올리고 p99 낮추기aiMilvus에서 HNSW 인덱스의 핵심 파라미터(M, efConstruction, ef)와 필터·세그먼트·캐시까지 함께 조정해 recall은 끌어올리고 p99 지연은 낮추는 실전 튜닝 절차를 정리합니다.Read more →
Published on2026년 1월 18일Nginx에서 JWT 401 간헐 발생 - 시계오차 해결techNginx 뒤에서 JWT 검증이 간헐적으로 401을 내는 경우, 대부분은 서버 간 시계 오차(clock skew)나 NTP 동기화 문제로 설명됩니다. 토큰 클레임과 검증 위치를 분리해 진단하고, 허용 오차·시간 동기화·관측성을 함께 잡는 실전 해결법을 정리합니다.Read more →