Published on2026년 1월 11일Rust+Qdrant RAG에서 벡터 드리프트 잡는 법aiRust로 RAG 파이프라인을 운영할 때 Qdrant의 벡터 드리프트(임베딩/코퍼스/인덱스 변화로 인한 검색 품질 저하)를 감지·격리·재색인하는 실전 패턴을 정리합니다.Read more →
Published on2026년 1월 11일Stable Diffusion VRAM OOM 없애는 6가지 최적화aiStable Diffusion 실행 중 CUDA out of memory(OOM)를 줄이기 위한 6가지 실전 최적화를 정리했습니다. 배치/해상도 튜닝부터 xFormers, FP16, VAE, 타일링까지 재현 가능한 설정과 코드로 설명합니다.Read more →
Published on2026년 1월 11일Transformers 로컬 LLM OOM - 4bit·KV캐시 최적화ai로컬에서 Transformers로 LLM을 돌릴 때 가장 흔한 OOM 원인을 모델 가중치·KV 캐시·배치/시퀀스 관점에서 분해하고, bitsandbytes 4bit 및 KV 캐시 최적화로 안정적으로 추론하는 실전 설정을 정리합니다.Read more →
Published on2026년 1월 11일TS 5.5+ 타입 추론 함정 7가지와 해결 패턴syntaxTypeScript 5.5+에서 자주 마주치는 타입 추론 함정 7가지를 실제 코드로 재현하고, 안전하게 우회하는 패턴(리터럴 고정, satisfies, 오버로드, 타입 가드 등)을 정리합니다.Read more →
Published on2026년 1월 11일vLLM+KServe로 LLM 서버리스 배포와 콜드스타트 최소화aivLLM을 KServe로 서버리스 배포하면서도 콜드스타트를 줄이는 실전 구성(이미지/모델 캐싱, 워밍업, 스케일 정책, GPU 스케줄링)을 정리합니다.Read more →