Published on2026년 1월 1일Spring Boot 3.2 HTTP/2 RST_STREAM 502 원인·해결syntaxSpring Boot 3.2에서 HTTP/2 사용 시 간헐적으로 502와 함께 RST_STREAM이 발생하는 원인을 네트워크 계층부터 애플리케이션 설정까지 추적하고, 재현·진단·해결책을 정리합니다.Read more →
Published on2026년 1월 1일Transformers 로컬 LLM CUDA OOM 줄이는 9가지ai로컬 LLM을 Transformers로 돌릴 때 가장 흔한 CUDA OOM을 9가지 실전 방법으로 줄입니다. dtype, KV 캐시, 디바이스 매핑, 메모리 단편화까지 재현 가능한 코드와 함께 정리했습니다.Read more →
Published on2026년 1월 1일Transformers 로컬 LLM OOM과 KV 캐시 최적화aiTransformers로 로컬 LLM을 돌릴 때 가장 흔한 OOM 원인을 메모리 구성요소별로 분해하고, KV 캐시를 중심으로 실전 최적화 옵션과 코드 패턴을 정리합니다.Read more →
Published on2026년 1월 1일Triton GPU 100%인데 느린 이유와 진단법aiTriton Inference Server에서 GPU 사용률이 100%인데도 지연시간과 TPS가 기대 이하인 원인을 병목 관점에서 분해합니다. NVML 사용률의 함정부터 배치/동시성, 전처리, 메모리 전송, 커널 효율까지 실전 진단 체크리스트와 해결책을 제공합니다.Read more →
Published on2026년 1월 1일TypeScript 5.5 noUncheckedIndexedAccess 오류 해결syntaxTypeScript 5.5에서 noUncheckedIndexedAccess를 켰을 때 자주 터지는 인덱싱 오류를 원인별로 분류하고, 안전하게 고치는 패턴을 코드로 정리합니다.Read more →