Published on2026년 2월 8일PyTorch 2.x PT2E INT8 양자화 실패 해결 가이드aiPyTorch 2.x의 PT2E 기반 INT8 양자화에서 자주 발생하는 실패 패턴을 재현하고, 그래프 캡처부터 캘리브레이션, 컨버전까지 단계별로 원인을 좁혀 해결하는 실전 가이드입니다.Read more →
Published on2026년 2월 8일PyTorch 모델을 ONNX+INT8로 4배 경량화하는 법aiPyTorch 모델을 ONNX로 내보낸 뒤 INT8 양자화를 적용해 모델 크기를 약 4배 줄이고, CPU/GPU 추론 비용을 낮추는 실전 절차를 정리합니다.Read more →
Published on2026년 2월 8일ReAct+툴콜 루프 무한반복 끊는 프롬프트 설계aiReAct 패턴과 툴콜을 결합할 때 흔히 발생하는 무한 루프를 프롬프트·상태머신·가드레일로 끊는 설계법을 정리합니다. 종료 조건, 예산, 오류 처리, 재시도 정책까지 실전 템플릿과 코드로 제공합니다.Read more →
Published on2026년 2월 8일Java/Spring 없이 SAGA 보상 트랜잭션 설계하기techJava/Spring 프레임워크에 의존하지 않고도 SAGA 보상 트랜잭션을 안전하게 설계하는 방법을 정리합니다. 오케스트레이션/코레오그래피 선택, 멱등성, 아웃박스, 재시도·중복 방지까지 실전 구현 포인트를 다룹니다.Read more →
Published on2026년 2월 8일Transformers 로컬 LLM OOM, bitsandbytes 4bit로 해결ai로컬에서 Transformers로 LLM을 돌리다 OOM이 나는 가장 흔한 원인은 가중치와 KV 캐시 메모리입니다. bitsandbytes 4bit(NF4) 로드로 VRAM을 크게 줄이는 실전 설정과 트러블슈팅을 정리합니다.Read more →