Published on2025년 12월 31일LlamaIndex+Qdrant RAG 재랭킹으로 환각 30%↓aiLlamaIndex와 Qdrant로 RAG를 구성한 뒤 재랭킹(reranking)을 추가해 환각을 유의미하게 줄이는 실전 패턴을 정리합니다. 검색 품질 측정, 재랭커 선택, 임계값 튜닝까지 한 번에 다룹니다.Read more →
Published on2025년 12월 31일Milvus HNSW 튜닝으로 RAG 정확도·지연 최적화aiMilvus에서 HNSW 인덱스 파라미터(M, efConstruction, efSearch)를 조합해 RAG 검색정확도와 지연을 동시에 최적화하는 실전 튜닝 가이드입니다. 측정 지표, 실험 설계, 운영 체크리스트까지 한 번에 정리합니다.Read more →
Published on2025년 12월 31일Milvus IVF_FLAT vs HNSW 리콜·지연 튜닝aiMilvus에서 IVF_FLAT과 HNSW를 리콜과 지연 관점에서 비교하고, nprobe·efSearch·M 등 핵심 파라미터로 목표 SLO에 맞게 튜닝하는 실전 가이드를 정리합니다.Read more →
Published on2025년 12월 31일Next.js 14 App Router RSC 캐시 꼬임 해결techNext.js 14 App Router에서 RSC 캐시가 꼬여 구버전 데이터·유저 섞임·리프레시 불가가 발생하는 원인을 정리하고, fetch 캐시·revalidate·태그 기반 무효화로 안정적으로 복구하는 실전 패턴을 소개합니다.Read more →
Published on2025년 12월 31일OpenAI API 429 Rate Limit 재시도·백오프 설계aiOpenAI API에서 429 Rate Limit이 발생할 때, 무작정 재시도하면 더 악화됩니다. 지수 백오프+지터, Retry-After 존중, 요청 큐잉과 동시성 제한까지 포함한 실전 설계를 정리합니다.Read more →