Published on2026년 2월 4일Stable Diffusion LoRA 얼굴 깨짐 - 버킷·해상도 튜닝aiLoRA 훈련 후 얼굴이 뭉개지거나 눈·입이 깨지는 원인을 버킷(해상도 분포)과 레졸루션 관점에서 진단하고, 실무에서 재현·개선하는 튜닝 방법을 정리합니다.Read more →
Published on2026년 2월 4일Transformers 로컬 LLM OOM? 4bit+오프로딩 실전ai로컬 GPU에서 Transformers LLM이 OOM 나는 원인을 분해하고, 4bit 양자화와 CPU/NVMe 오프로딩으로 실사용 가능한 설정을 만드는 실전 가이드입니다.Read more →
Published on2026년 2월 4일Transformers 로컬 LLM RoPE 스케일링 오류 해결aiTransformers로 로컬 LLM을 돌릴 때 자주 만나는 RoPE 스케일링 관련 로딩/추론 오류를 원인별로 분해해 해결합니다. 모델 설정값 불일치, 라이브러리 버전 문제, 컨텍스트 확장 파라미터 적용 실수까지 재현 코드와 함께 정리합니다.Read more →
Published on2026년 2월 3일FastAPI Uvicorn에서 SSE 웹소켓 LLM 스트리밍이 프록시 뒤에서 끊길 때 Cloudflare Nginx ALB 버퍼 타임아웃 gzip으로 EventSource failed 100% 재현 해결 체크리스트aiFastAPI+Uvicorn 기반 SSE/웹소켓 LLM 스트리밍이 Cloudflare/Nginx/ALB 같은 프록시 뒤에서 갑자기 끊기는 문제를 EventSource failed로 100% 재현하고, buffer/timeout/gzip 설정을 중심으로 확실히 해결하는 실전 체크리스트를 정리합니다.Read more →
Published on2026년 2월 3일KServe GPU 서빙 CrashLoopBackOff 8가지 원인aiKServe로 GPU 모델을 서빙할 때 CrashLoopBackOff가 반복되는 대표 원인 8가지를 로그/이벤트 기반으로 빠르게 좁히는 실전 점검표입니다.Read more →