All Posts

  • Published on
    Qdrant의 HNSW 파라미터를 실제 RAG 트래픽 기준으로 튜닝해 검색 지연을 낮추고 recall을 유지하는 방법을 정리합니다. 인덱싱·서치·메모리·운영 관점의 체크리스트와 재현 가능한 실험 코드를 제공합니다.
  • Published on
    Rust에서 자주 마주치는 E0502/E0499는 동시에 빌릴 수 없는 참조 규칙을 어겼다는 신호입니다. 원인을 빠르게 분류하고, 스코프 분리·재구조화·내부 가변성 등 실전 해결 패턴을 코드로 정리합니다.
  • Published on
    Chain-of-Thought를 한 번만 생성하지 말고 k번 샘플링한 뒤 자기일관성(Self-Consistency) 투표로 최종 답을 고르면, 추론 정확도를 안정적으로 끌어올릴 수 있습니다. 구현 패턴, k/temperature 튜닝, RAG 결합 시 주의점을 실전 관점에서 정리합니다.