All Posts

  • Published on
    CoT(Chain-of-Thought) 유출을 줄이기 위해 출력 포맷을 JSON으로 강제하고, 스키마 검증·재시도 루프를 결합하는 실전 패턴을 정리합니다. Next.js/서버 환경에서 바로 붙일 수 있는 프롬프트 템플릿과 검증 코드까지 제공합니다.
  • Published on
    체인오브쏘트(CoT) 유출을 막으면서도 정답률을 유지하는 프롬프트·서빙·평가 전략을 정리합니다. 요약형 답변, 검증 루프, self-consistency 등으로 성능을 지키는 실전 패턴을 다룹니다.
  • Published on
    PyTorch 모델을 INT8 PTQ로 양자화할 때 ONNXRuntime QDQ 포맷에서 자주 터지는 함정 7가지를 정리합니다. 정확도 급락, 성능 역전, 배포 불일치까지 재현 가능한 체크리스트와 코드로 해결합니다.
  • Published on
    Ray Serve 배포 직후 503이 뜨거나 로드밸런서 헬스체크가 실패하는 대표 원인 7가지를 진단 순서대로 정리했습니다. 로그·포트·라우팅·리소스·프로브 설정까지 재현 가능한 체크리스트와 코드 예제를 포함합니다.