Published on2026년 1월 18일Transformers 로컬 LLM OOM? 8bit·Q4·KV캐시로 해결ai로컬에서 Transformers로 LLM을 돌리다 OOM이 나는 핵심 원인을 VRAM 구성요소(가중치·KV 캐시·활성화)로 분해하고, 8bit/4bit 양자화와 KV 캐시 최적화로 실전 해결하는 방법을 정리합니다.Read more →
Published on2026년 1월 18일TS 5.5+ const 타입 파라미터 추론 오류 해결syntaxTypeScript 5.5+에서 `const` 타입 파라미터를 썼을 때 기대한 리터럴 추론이 깨지거나 오히려 타입 에러가 나는 케이스를 정리합니다. 재현 코드, 원인, 그리고 실무에서 바로 쓰는 우회·해결 패턴까지 한 번에 다룹니다.Read more →
Published on2026년 1월 17일GCP Cloud Run 503 해결 - VPC 커넥터·NAT 점검aiCloud Run에서 503이 터질 때 VPC 커넥터와 Cloud NAT 구성이 원인인 경우가 많습니다. 네트워크 경로(egress)·포트·서브넷·NAT 로그를 기준으로 빠르게 원인을 좁히고 재발을 막는 방법을 정리합니다.Read more →
Published on2026년 1월 17일Kubernetes ImagePullBackOff - ECR 403 해결 가이드aiECR에서 403이 발생해 Pod가 ImagePullBackOff에 빠질 때, 원인을 빠르게 분류하고 IAM·IRSA·imagePullSecret·네트워크까지 단계별로 복구하는 실전 가이드입니다.Read more →
Published on2026년 1월 17일LangChain 에이전트 무한루프·툴난사 차단법aiLangChain 에이전트가 같은 툴을 반복 호출하거나 종료하지 못하는 무한루프를 실무적으로 차단하는 방법을 정리합니다. 반복 감지, 단계/시간 예산, 툴 게이팅, 관측성까지 코드로 구현합니다.Read more →