All Posts

  • Published on
    OpenAI Structured Outputs 사용 중 400(Bad Request)이 나는 대표 원인(스키마 비호환, strict 위반, union/nullable 표현 오류 등)을 실제 JSON Schema 관점에서 정리합니다. 재현 가능한 코드와 함께, 실패를 줄이는 스키마 작성 패턴과 디버깅 체크리스트를 제공합니다.
  • Published on
    pgvector의 HNSW 인덱스를 RAG 검색에 맞게 튜닝해 지연시간을 3배 수준으로 줄이는 실전 방법을 정리합니다. `m`, `ef_construction`, `ef_search`, 필터 조합, VACUUM/ANALYZE와 쿼리 패턴까지 함께 다룹니다.