Published on2025년 12월 28일PyTorch 2.3 PT2E+XNNPACK로 INT8 양자화aiPyTorch 2.3에서 PT2E(Export) 기반 양자화 파이프라인으로 XNNPACK INT8 모델을 만드는 방법을 정리합니다. 준비물, 캘리브레이션, 변환, 흔한 함정과 디버깅 포인트까지 실전 관점으로 다룹니다.Read more →
Published on2025년 12월 28일PyTorch→ONNX→TensorRT INT8 양자화 오류 해결aiPyTorch 모델을 ONNX로 내보낸 뒤 TensorRT INT8 양자화에서 자주 터지는 오류를 원인별로 정리하고, 재현 가능한 해결 절차와 코드 템플릿을 제공합니다.Read more →
Published on2025년 12월 28일LLM 프롬프트 캐시로 비용 70% 줄이는 법ai반복되는 시스템 프롬프트와 컨텍스트를 캐시하면 토큰 비용과 지연시간을 동시에 줄일 수 있습니다. 프롬프트 캐시 설계부터 키 전략, 무효화, 관측까지 실전 패턴을 정리합니다.Read more →
Published on2025년 12월 28일SDXL+ComfyUI로 VRAM OOM 없이 4K 배치 생성aiSDXL을 ComfyUI에서 4K로 배치 생성할 때 VRAM OOM이 나는 원인을 분해하고, 타일링·VAE 분리·메모리 최적화로 안정적으로 처리하는 워크플로우를 정리합니다.Read more →
Published on2025년 12월 28일SDXL+ControlNet 메모리폭주 OOM 해결 8가지aiSDXL에 ControlNet을 얹을 때 VRAM이 급격히 치솟아 OOM이 나는 대표 원인과, 품질을 최대한 유지하면서 메모리 사용량을 줄이는 8가지 실전 해법을 정리합니다.Read more →