Published on2026년 1월 26일RAG 검색 정확도 폭락? 하이브리드+Rerank 튜닝aiRAG에서 검색 정확도가 갑자기 떨어질 때는 임베딩만 의심하면 놓치는 지점이 많습니다. 하이브리드 검색과 rerank를 중심으로 원인 분해, 튜닝 순서, 실전 파라미터를 정리합니다.Read more →
Published on2026년 1월 26일Chain-of-Thought 없이 추론 유도하는 5패턴aiChain-of-Thought를 강제로 요구하지 않고도 LLM의 추론 품질을 끌어올리는 5가지 프롬프트/설계 패턴을 정리합니다. 안전·재현성·디버깅 관점에서 바로 적용 가능한 템플릿과 코드 예제를 제공합니다.Read more →
Published on2026년 1월 26일Spring Boot OutOfMemoryError 덤프 분석·튜닝 7단계techSpring Boot에서 OutOfMemoryError가 났을 때 힙/스레드 덤프를 확보하고, MAT/Native Memory Tracking으로 원인을 좁힌 뒤, JVM·컨테이너·코드 레벨까지 튜닝하는 7단계 실전 절차를 정리합니다.Read more →
Published on2026년 1월 26일Stable Diffusion LoRA 병합 후 색감 깨짐 해결aiLoRA를 체크포인트에 병합한 뒤 채도가 튀거나 피부톤이 깨지는 문제는 대개 VAE·색공간·병합 방식·가중치 스케일에서 발생합니다. 원인별 점검 순서와 재현 가능한 해결 레시피를 정리합니다.Read more →
Published on2026년 1월 26일torch.compile 모델을 ONNX+TensorRT INT8로 배포하기aiPyTorch 2.0의 torch.compile로 학습·추론을 가속한 뒤, ONNX로 내보내 TensorRT INT8까지 연결해 실서비스 배포 파이프라인을 구성하는 방법을 정리합니다.Read more →