All Posts

  • Published on
    PyTorch에서 INT8 양자화(PTQ/QAT, 동적/정적)를 적용해 CPU 추론 지연을 크게 줄이는 실전 가이드입니다. 측정 방법, 정확도 저하를 통제하는 캘리브레이션, 배포 체크리스트까지 한 번에 정리합니다.
  • Published on
    Stable Diffusion 실행 중 CUDA Out of Memory(OOM)가 나는 원인을 VRAM 관점에서 분해하고, 효과가 큰 순서대로 7단계 해결책을 정리합니다. WebUI, ComfyUI, PyTorch 공통으로 적용 가능한 체크리스트와 명령어를 제공합니다.
  • Published on
    AutoGPT에 MCP(Model Context Protocol)로 사내툴을 연결할 때 가장 먼저 설계해야 할 권한(Authorization)과 감사로그(Audit Log) 체계를 정리합니다. 최소권한, 토큰 위임, 정책엔진, 불변 로그까지 실무 구현 관점으로 다룹니다.