Published on2026년 2월 4일Seldon Core로 GPU 추론 롤링배포·카나리 실전aiSeldon Core에서 GPU 추론 서버를 운영할 때 필요한 롤링 배포와 카나리 릴리스를 실전 관점으로 정리합니다. 모델 버전 전환, 트래픽 분할, 헬스체크·오토스케일·장애 대응까지 한 번에 연결합니다.Read more →
Published on2026년 2월 4일Spring Boot 3 Actuator로 p99 지연 원인 추적techSpring Boot 3 Actuator와 Micrometer 지표를 이용해 p99 지연을 ‘어디서’ 발생하는지 쪼개 추적하는 실전 접근을 정리합니다. HTTP, 스레드/커넥션 풀, DB, GC/CPU 병목을 단계적으로 좁히는 방법을 다룹니다.Read more →
Published on2026년 2월 4일Spring Boot 3 가상스레드 적용 후 성능저하 원인techSpring Boot 3에서 가상스레드를 켰는데 TPS가 떨어지거나 지연이 늘어나는 경우가 있습니다. 대표적인 병목 패턴과 진단 포인트, 그리고 실제로 성능을 되돌리는 설정·코드 개선 방법을 정리합니다.Read more →
Published on2026년 2월 4일Stable Diffusion VRAM OOM 없이 2배 빠르게aiStable Diffusion에서 VRAM OOM을 피하면서도 체감 속도를 2배까지 끌어올리는 실전 설정을 정리합니다. WebUI/ComfyUI와 diffusers 공통으로 적용 가능한 메모리·속도 튜닝 체크리스트를 제공합니다.Read more →
Published on2026년 2월 4일Stable Diffusion 4K 생성, VRAM OOM 없이 끝내기aiStable Diffusion에서 4K 이미지를 만들 때 VRAM OOM이 나는 근본 원인과, 타일링·업스케일·메모리 최적화 조합으로 안정적으로 4K를 생성하는 실전 레시피를 정리합니다.Read more →