All Posts

  • Published on
    PyTorch 2.x에서 PTQ로 int8 양자화 시 정확도가 급락하는 대표 원인(캘리브레이션, 관측기 설정, 레이어 폴딩, 스케일/제로포인트, 연산자 지원)을 체계적으로 점검하고, 재현 가능한 코드로 안정화 방법을 정리합니다.
  • Published on
    Chain-of-Thought를 길게 요구하지 않고도 환각을 줄이는 방법은 많습니다. 이 글은 Structured Output(스키마 기반 출력)로 검증 가능성을 높이고, 파이프라인에서 오류를 조기에 차단하는 실전 패턴을 정리합니다.
  • Published on
    HyDE로 검색 질의를 보강하고 rerank로 근거 문서를 정밀 선별해 RAG 환각을 체계적으로 줄이는 튜닝 절차를 정리합니다. 오프라인 평가·임계값·프롬프트까지 함께 다룹니다.
  • Published on
    SDXL LoRA 학습이 갑자기 수렴하지 않거나 결과물이 붕괴될 때, 가장 흔한 7가지 원인을 데이터·설정·옵티마이저·정밀도·캐시 관점에서 진단합니다. 재현 가능한 체크리스트와 코드 스니펫으로 빠르게 원인을 좁혀봅니다.