Published on2026년 2월 23일CoT 누출 막기 - SCoT·Verifier로 정답률 올리기aiChain-of-Thought(CoT) 노출 없이도 정답률을 끌어올리는 SCoT와 Verifier(검증기) 패턴을 정리합니다. 운영 환경에서 안전한 추론, 평가, 라우팅까지 실전 구현 관점으로 설명합니다.Read more →
Published on2026년 2월 23일PyTorch 2.0+ PTQ로 INT8 변환해 3배 가속하기aiPyTorch 2.0+에서 PTQ로 FP32 모델을 INT8로 변환해 CPU 추론을 가속하는 실전 가이드입니다. 준비물, 캘리브레이션, 성능 측정, 정확도 저하를 줄이는 팁까지 한 번에 정리합니다.Read more →
Published on2026년 2월 23일RAG 정확도 급락? 청크·재랭킹 튜닝 9단계aiRAG 정확도가 갑자기 떨어질 때는 임베딩 모델이 아니라 청크 전략, 검색 파라미터, 재랭킹, 컨텍스트 구성에서 문제가 나는 경우가 많습니다. 이 글은 재현 가능한 진단 지표와 함께 청크·재랭킹을 중심으로 9단계 튜닝 체크리스트를 제공합니다.Read more →
Published on2026년 2월 23일Stable Diffusion VRAM OOM, xFormers·Tiling 최적화aiStable Diffusion에서 VRAM OOM이 나는 핵심 원인을 분해하고, xFormers 메모리 효율 어텐션과 VAE/Latent 타일링으로 실제로 메모리를 줄이는 설정 조합을 정리합니다.Read more →
Published on2026년 2월 22일Claude 429 과금폭탄 막는 재시도·백오프 전략aiAnthropic Claude에서 429(레이트 리밋)로 재시도 루프가 생기면 토큰이 빠르게 소모되어 비용이 폭증할 수 있습니다. 안정적인 재시도·백오프·지터·서킷 브레이커로 과금폭탄을 막는 실전 패턴을 정리합니다.Read more →