Published on2026년 1월 19일PyTorch 2.x PTQ int8 정확도 급락 해결 가이드aiPyTorch 2.x에서 PTQ로 int8 양자화 시 정확도가 급락하는 대표 원인(캘리브레이션, 관측기 설정, 레이어 폴딩, 스케일/제로포인트, 연산자 지원)을 체계적으로 점검하고, 재현 가능한 코드로 안정화 방법을 정리합니다.Read more →
Published on2026년 1월 19일PyTorch→ONNX→TensorRT INT8 양자화 실수 7가지aiPyTorch 모델을 ONNX로 내보낸 뒤 TensorRT에서 INT8 양자화를 적용할 때 자주 터지는 7가지 실수를 정리합니다. 정확도 하락, 엔진 빌드 실패, 성능 역전의 원인을 체크리스트처럼 해결해봅니다.Read more →
Published on2026년 1월 19일CoT 대신 Structured Output로 환각 줄이기aiChain-of-Thought를 길게 요구하지 않고도 환각을 줄이는 방법은 많습니다. 이 글은 Structured Output(스키마 기반 출력)로 검증 가능성을 높이고, 파이프라인에서 오류를 조기에 차단하는 실전 패턴을 정리합니다.Read more →
Published on2026년 1월 19일RAG 환각 줄이기 - HyDE+rerank 튜닝 실전aiHyDE로 검색 질의를 보강하고 rerank로 근거 문서를 정밀 선별해 RAG 환각을 체계적으로 줄이는 튜닝 절차를 정리합니다. 오프라인 평가·임계값·프롬프트까지 함께 다룹니다.Read more →
Published on2026년 1월 19일SDXL LoRA 학습이 망가질 때 원인 7가지aiSDXL LoRA 학습이 갑자기 수렴하지 않거나 결과물이 붕괴될 때, 가장 흔한 7가지 원인을 데이터·설정·옵티마이저·정밀도·캐시 관점에서 진단합니다. 재현 가능한 체크리스트와 코드 스니펫으로 빠르게 원인을 좁혀봅니다.Read more →