All Posts

  • Published on
    Milvus에서 IVF_FLAT과 HNSW 인덱스를 워크로드에 맞게 튜닝해 검색 지연을 절반 수준으로 줄이는 실전 체크리스트를 정리합니다. 파라미터 선택 기준, 측정 방법, 운영에서 흔히 놓치는 병목까지 함께 다룹니다.
  • Published on
    PostgreSQL pgvector로 RAG를 운영할 때 지연을 줄이는 핵심은 인덱스(IVF/HNSW)와 검색 파라미터를 데이터 분포·QPS·리콜 목표에 맞게 튜닝하는 것입니다. 이 글은 측정부터 인덱스 선택, 파라미터 조정, 운영 체크리스트까지 실전 위주로 정리합니다.