Published on2026년 2월 11일MySQL InnoDB 데드락 로그로 범인 쿼리 찾기techInnoDB 데드락 로그를 읽어 어떤 쿼리가 어떤 락을 잡고 충돌했는지 추적하는 방법을 정리합니다. 운영에서 바로 써먹을 수 있는 로그 해석 포인트와 재현·개선 전략까지 다룹니다.Read more →
Published on2026년 2월 11일OpenAI API 429 Rate Limit 재시도·큐잉 설계aiOpenAI API에서 429 Rate Limit 에러가 발생할 때 무작정 재시도하면 더 악화됩니다. 지수 백오프, 지터, 토큰 기반 큐잉과 동시성 제어로 안정적으로 처리하는 실전 패턴을 정리합니다.Read more →
Published on2026년 2월 11일OpenAI Batch API로 대량 요약 비용 90% 절감하기ai대량 문서 요약 파이프라인을 실시간 호출 대신 Batch API로 전환해 비용을 크게 낮추는 방법을 정리했습니다. 입력 포맷, 운영 설계, 실패 재처리까지 실전 관점으로 다룹니다.Read more →
Published on2026년 2월 11일pgvector HNSW 튜닝으로 RAG 검색지연 50% 줄이기aipgvector의 HNSW 인덱스를 제대로 튜닝하면 RAG 검색 지연을 체감 수준으로 줄일 수 있습니다. m·ef_construction·ef_search·리콜 목표를 기준으로 측정-조정하는 실전 절차를 정리합니다.Read more →
Published on2026년 2월 11일pgvector RAG 인덱스 튜닝 - IVFFlat·HNSW 실전aipgvector로 RAG 검색 품질과 지연을 동시에 잡는 IVFFlat·HNSW 인덱스 튜닝 실전 가이드. recall, latency, 비용을 균형 있게 맞추는 파라미터와 운영 체크리스트를 정리합니다.Read more →