All Posts

  • Published on
    CoT(Chain-of-Thought) 유출을 막으면서도 모델 품질을 유지하려면 출력 형식을 강제하고, 정책 위반을 감지·차단하는 가드레일을 결합해야 합니다. JSON Schema 기반 구조화 출력과 Guardrails 검증 파이프라인으로 실전 방어 패턴을 정리합니다.
  • Published on
    LLM이 설명(Chain-of-Thought)을 길게 노출하거나 형식을 깨는 문제를 줄이기 위해, JSON 전용 출력 가드 프롬프트를 설계하는 방법을 정리합니다. 실패 패턴과 방어 레이어, 검증·재시도까지 실전 예제로 다룹니다.
  • Published on
    학습 없이 PTQ로 PyTorch 모델을 INT8로 변환하면서 정확도를 최대한 유지하는 실전 절차를 정리합니다. 캘리브레이션 데이터, 관측자 설정, 레이어별 예외 처리까지 다룹니다.
  • Published on
    Stable Diffusion SDXL에서 흔한 VRAM OOM(폭발) 문제를 VAE 교체·정밀 VAE·Tiling·타일드 디코드로 안정화하는 방법을 정리합니다. WebUI/ComfyUI 기준으로 재현 원인부터 설정 조합까지 실전 체크리스트를 제공합니다.