Published on2026년 1월 3일Transformers 로컬 LLM OOM 해결 - 4bit+Offloadai로컬에서 Transformers로 LLM을 돌리다 OOM이 나는 가장 흔한 원인을 정리하고, 4bit 양자화와 CPU/NVMe offload로 VRAM 한계를 넘는 실전 로딩 패턴을 코드로 설명합니다.Read more →
Published on2026년 1월 3일TS 5.5 const type params로 타입추론 고치기syntaxTypeScript 5.5의 const type parameters로 리터럴 추론이 무너지는 지점을 복구하고, API 설계에서 안전하게 적용하는 패턴을 정리합니다.Read more →
Published on2026년 1월 2일AutoGPT 무한루프·비용폭주 막는 가드레일 7가지aiAutoGPT류 에이전트는 한 번 삐끗하면 무한 루프와 토큰·API 비용 폭주로 이어집니다. 실무에서 바로 적용 가능한 7가지 가드레일을 코드와 함께 정리합니다.Read more →
Published on2026년 1월 2일AutoGPT 메모리 폭주 해결 - 벡터DB+요약 캐시aiAutoGPT가 장기 실행 중 메모리가 폭주하는 근본 원인을 분해하고, 벡터DB TTL/압축 + 요약 캐시(계층형 메모리)로 비용과 지연을 동시에 낮추는 구현 패턴을 정리합니다.Read more →
Published on2026년 1월 2일AWS Bedrock Claude InvokeModel 429·Throttling 해결aiAWS Bedrock에서 Claude InvokeModel 호출 시 429/ThrottlingException이 발생하는 원인을 쿼터·동시성·재시도 전략 관점에서 정리합니다. 지수 백오프+지터, 토큰 버짓, 큐잉/레이트리밋, Lambda·EKS 운영 팁까지 실전 해결책을 제공합니다.Read more →