Published on2026년 1월 6일PyTorch 2.1 PT2E로 INT8 양자화 모델 만들기aiPyTorch 2.1의 PT2E(Prepare/Convert to Edge) 플로우로 INT8 양자화 모델을 만드는 과정을 실전 코드로 정리합니다. 캘리브레이션, 백엔드 선택, 정확도·성능 검증, 흔한 함정까지 한 번에 다룹니다.Read more →
Published on2026년 1월 6일PyTorch 2.0 PT2E+INT8 양자화 정확도 지키기aiPyTorch 2.0의 PT2E(Prepare/Convert Export) 기반 INT8 양자화에서 정확도가 떨어지는 대표 원인과, 관측자·캘리브레이션·QConfig·레이어 예외 처리로 정확도를 방어하는 실전 체크리스트를 정리합니다.Read more →
Published on2026년 1월 6일PyTorch PTQ·QAT 정확도 급락 원인·복구 7단계aiPyTorch에서 PTQ나 QAT 적용 후 정확도가 급락하는 대표 원인을 체계적으로 분류하고, 재현·진단·복구를 위한 7단계 체크리스트와 코드 예제를 제공합니다.Read more →
Published on2026년 1월 6일RAG 리콜 급락? HNSW 파라미터 튜닝 가이드aiRAG 검색 리콜이 갑자기 떨어질 때 HNSW의 핵심 파라미터(`M`, `efConstruction`, `efSearch`)를 어떻게 측정·튜닝해야 하는지, 재현 가능한 실험 방법과 운영 체크리스트로 정리합니다.Read more →
Published on2026년 1월 6일RAG 벡터DB 드리프트 잡는 재색인·하이브리드 검색aiRAG 품질을 떨어뜨리는 벡터DB 드리프트를 관측·진단하고, 재색인(리임베딩)과 하이브리드 검색으로 안정적으로 복구하는 실전 전략을 정리합니다.Read more →