Published on2026년 2월 20일Ray Serve로 LLM 추론 배포 - 배치·오토스케일 튜닝aiRay Serve로 LLM 추론을 배포할 때 처리량을 올리는 배치 전략과, 지연을 망치지 않는 오토스케일 파라미터 튜닝 방법을 실전 관점에서 정리합니다.Read more →
Published on2026년 2월 20일SDXL 로라·컨트롤넷 조합 성능 튜닝 실전aiSDXL에서 LoRA와 ControlNet을 함께 쓸 때 품질과 속도, VRAM을 동시에 잡는 튜닝 절차를 정리합니다. 충돌 패턴과 파라미터 우선순위를 기준으로 재현 가능한 실전 레시피를 제공합니다.Read more →
Published on2026년 2월 20일Seldon Core v2로 K8s LLM 카나리 배포·롤백aiSeldon Core v2로 Kubernetes에서 LLM(예 - vLLM/TGI) 카나리 배포를 구성하고, 메트릭 기반 승격/롤백까지 운영 관점에서 정리합니다.Read more →
Published on2026년 2월 20일Stable Diffusion LoRA 학습 NaN·검은 이미지 해결aiLoRA 학습 중 손실이 NaN으로 터지거나 결과가 검은 이미지로 나올 때, 데이터·설정·정밀도·옵티마이저 관점에서 원인을 빠르게 좁히고 재발을 막는 체크리스트를 정리합니다.Read more →
Published on2026년 2월 20일Stable Diffusion VRAM 부족 해결 - xFormers·TilingaiStable Diffusion 실행 중 CUDA OOM(VRAM 부족)을 줄이기 위한 실전 설정을 정리합니다. xFormers 메모리 효율 어텐션과 VAE/Latent 타일링을 조합해 저사양 GPU에서도 해상도·배치를 끌어올리는 방법을 다룹니다.Read more →