Published on2026년 1월 14일CoT 유출 없이 추론 강화하는 RAG+Verifier 프롬프트aiRAG로 근거를 보강하면서도 Chain-of-Thought(CoT) 유출을 막는 Verifier 프롬프트 패턴을 정리합니다. 답변 품질을 끌어올리되, 내부 추론은 숨기고 검증 가능한 근거만 남기는 실전 설계를 다룹니다.Read more →
Published on2026년 1월 14일Ray Serve 배포 OOMKilled·콜드스타트 5분 줄이기aiRay Serve를 Kubernetes에 배포할 때 자주 터지는 OOMKilled와 5분짜리 콜드스타트를, 메모리 모델링·리소스 설정·이미지/캐시·프로브·초기화 분리로 실전 수준에서 해결합니다.Read more →
Published on2026년 1월 14일Spring Boot HikariCP 커넥션 누수 진단·해결aiHikariCP 커넥션 누수는 트래픽이 늘수록 DB 풀 고갈과 지연, 타임아웃으로 이어집니다. 누수 징후를 로그·메트릭·스레드 덤프로 확인하고, 코드/트랜잭션/풀 설정까지 단계적으로 고치는 실전 방법을 정리합니다.Read more →
Published on2026년 1월 14일Terraform로 EKS 업그레이드 후 aws-auth 꼬임으로 노드 Join 실패 해결aiTerraform로 EKS 버전 업그레이드 이후 노드가 클러스터에 Join하지 못하는 대표 원인인 aws-auth ConfigMap 꼬임을 진단하고, 안전하게 복구·자동화하는 방법을 정리합니다.Read more →
Published on2026년 1월 14일Transformers 로컬 LLM 2배 가속 - KV 캐시·FA2aiTransformers로 로컬 LLM 추론 속도를 2배 수준까지 끌어올리는 실전 체크리스트를 정리합니다. KV 캐시 활용, FlashAttention2 적용, 병목 측정과 주의점을 코드 중심으로 설명합니다.Read more →