Published on2025년 12월 30일Stable Diffusion VRAM OOM, xFormers·VAE로 해결aiStable Diffusion에서 VRAM OOM이 나는 핵심 원인(어텐션·VAE·해상도·배치)을 분해하고, xFormers/SDPA, VAE 교체, 메모리 최적화 옵션으로 재현 가능하게 해결하는 방법을 정리합니다.Read more →
Published on2025년 12월 30일Stable Diffusion VRAM OOM 해결 - xFormers·SDPA·VAE 타일링aiStable Diffusion에서 VRAM OOM이 나는 근본 원인(어텐션·VAE 디코드·해상도)을 분해하고, xFormers/SDPA/메모리 효율 옵션과 VAE 타일링으로 안정적으로 해결하는 실전 설정을 정리합니다.Read more →
Published on2025년 12월 29일KServe GPU 추론 503·콜드스타트 줄이는 법aiKServe로 GPU 추론을 배포할 때 자주 터지는 503과 콜드스타트 문제를 원인별로 분해하고, Knative 설정·프로브·이미지·스케줄링·캐시 전략으로 안정화하는 실전 체크리스트를 정리합니다.Read more →
Published on2025년 12월 29일KServe+Knative GPU 추론 503·콜드스타트 해결aiKServe+Knative 기반 GPU 추론에서 자주 터지는 503과 콜드스타트를 관측·원인분해·설정으로 줄이는 실전 가이드입니다. queue-proxy 타임아웃, scale-to-zero, GPU 초기화 지연, readiness 설계를 한 번에 정리합니다.Read more →
Published on2025년 12월 29일LangChain 에이전트 무한루프·툴폭주 7가지 차단법aiLangChain 에이전트가 무한 루프에 빠지거나 툴을 과도 호출하는 문제를 7가지 실전 차단법으로 정리합니다. 시간·비용 상한, 상태 머신화, 멱등성, 관측성까지 코드 중심으로 다룹니다.Read more →