Published on2026년 1월 18일LLM SSE 스트리밍 499 502 급증과 응답 끊김을 잡는 프록시 튜닝 체크리스트aiLLM 스트리밍(SSE)에서 499/502가 늘고 응답이 끊길 때, Nginx/Envoy의 버퍼링·idle_timeout·HTTP/2 설정을 점검해 TTFB와 중단률을 동시에 낮추는 실전 체크리스트를 정리합니다.Read more →
Published on2026년 1월 18일Milvus HNSW 튜닝 - recall 올리고 p99 낮추기aiMilvus에서 HNSW 인덱스의 핵심 파라미터(M, efConstruction, ef)와 필터·세그먼트·캐시까지 함께 조정해 recall은 끌어올리고 p99 지연은 낮추는 실전 튜닝 절차를 정리합니다.Read more →
Published on2026년 1월 18일Nginx에서 JWT 401 간헐 발생 - 시계오차 해결techNginx 뒤에서 JWT 검증이 간헐적으로 401을 내는 경우, 대부분은 서버 간 시계 오차(clock skew)나 NTP 동기화 문제로 설명됩니다. 토큰 클레임과 검증 위치를 분리해 진단하고, 허용 오차·시간 동기화·관측성을 함께 잡는 실전 해결법을 정리합니다.Read more →
Published on2026년 1월 18일Node 22에서 require() 막힘? ESM 전환 실전syntaxNode 22에서 CommonJS의 require()가 갑자기 막힌 것처럼 보이는 이유와, 실제 프로젝트를 ESM으로 안전하게 전환하는 방법을 단계별로 정리합니다.Read more →
Published on2026년 1월 18일OpenAI 429/Rate Limit 재시도·큐잉 패턴 7가지aiOpenAI API에서 429 Rate Limit이 발생할 때 단순 재시도만으로는 해결되지 않습니다. 재시도·백오프·큐잉을 조합한 7가지 실전 패턴과 구현 포인트를 정리합니다.Read more →