Published on2026년 1월 25일RAG 검색 품질 급락? 하이브리드+RRF 튜닝 가이드aiRAG 검색 품질이 갑자기 떨어질 때, 단일 벡터 검색을 하이브리드 검색으로 전환하고 RRF로 결합·튜닝하는 실전 방법을 정리합니다. 지표 설계부터 가중치·`k`·필터링·리랭킹까지 재현 가능한 체크리스트를 제공합니다.Read more →
Published on2026년 1월 25일React 19 useTransition 무한 로딩 해결법techReact 19에서 useTransition 사용 시 pending이 끝나지 않아 로딩이 무한히 도는 원인을 유형별로 정리하고, 재현 코드와 함께 안전한 해결 패턴을 제시합니다.Read more →
Published on2026년 1월 25일CoT 없이도 정확도↑ - Self-Consistency 구현ai체인 오브 쏘트(CoT)를 노출하지 않고도 LLM 정답률을 끌어올리는 Self-Consistency를 실무 관점에서 구현합니다. 샘플링·집계·검증 루프와 운영 시 비용/지연 트레이드오프까지 다룹니다.Read more →
Published on2026년 1월 25일Transformers 로컬 LLM OOM, vLLM·PagedAttention로 끝내기aiTransformers로 로컬 LLM을 돌릴 때 자주 터지는 CUDA OOM의 핵심 원인을 KV 캐시 관점에서 정리하고, vLLM의 PagedAttention으로 메모리 단편화와 동시성 문제를 해결하는 실전 설정을 소개합니다.Read more →
Published on2026년 1월 24일LangChain Tool Calling 무한루프 끊는 6패턴aiLangChain Tool Calling에서 에이전트가 같은 툴을 반복 호출하며 빠지는 무한루프를 6가지 실전 패턴으로 끊는 방법을 정리합니다. 종료 조건, 상태머신, idempotency, 관측성까지 코드로 바로 적용합니다.Read more →