Published on2026년 1월 17일Kubernetes ImagePullBackOff - ECR 403 해결 가이드aiECR에서 403이 발생해 Pod가 ImagePullBackOff에 빠질 때, 원인을 빠르게 분류하고 IAM·IRSA·imagePullSecret·네트워크까지 단계별로 복구하는 실전 가이드입니다.Read more →
Published on2026년 1월 17일LangChain 에이전트 무한루프·툴난사 차단법aiLangChain 에이전트가 같은 툴을 반복 호출하거나 종료하지 못하는 무한루프를 실무적으로 차단하는 방법을 정리합니다. 반복 감지, 단계/시간 예산, 툴 게이팅, 관측성까지 코드로 구현합니다.Read more →
Published on2026년 1월 17일LangChain 에이전트 툴콜링 무한루프 7원인aiLangChain 에이전트가 툴 호출을 멈추지 못하고 무한루프에 빠지는 대표 원인 7가지를 정리합니다. 재현 패턴, 로그 포인트, 프롬프트·스키마·상태관리·가드레일로 끊는 실전 처방을 함께 제공합니다.Read more →
Published on2026년 1월 17일로컬 LLM OOM·속도 해결 - bitsandbytes+KV 캐시ai로컬에서 LLM을 돌리다 OOM이 나거나 생성 속도가 너무 느릴 때, bitsandbytes 4/8bit 양자화와 KV 캐시 최적화로 VRAM을 줄이고 TPS를 끌어올리는 실전 방법을 정리합니다.Read more →
Published on2026년 1월 17일Milvus HNSW 튜닝으로 recall·latency 최적화aiMilvus에서 HNSW 인덱스를 사용할 때 recall과 latency를 동시에 만족시키기 위한 핵심 파라미터(M, efConstruction, efSearch)와 실전 튜닝 절차를 정리합니다.Read more →