Published on2026년 2월 14일리눅스 Too many open files - ulimit·fd 해결ai리눅스에서 Too many open files 에러가 발생하는 원인을 프로세스 FD 한도, systemd, 커널 fs.file-max 관점에서 정리하고, 서비스별로 안전하게 한도를 올리는 실전 절차를 제시합니다.Read more →
Published on2026년 2월 14일Milvus RAG 리콜 급락? HNSW 파라미터 튜닝aiMilvus에서 RAG 검색 리콜이 갑자기 떨어질 때, HNSW 인덱스와 검색 파라미터를 어떻게 점검·튜닝해야 하는지 실전 기준으로 정리합니다.Read more →
Published on2026년 2월 14일OpenAI 429 Rate Limit 재시도·백오프 실전 가이드aiOpenAI API에서 429 Rate Limit 에러가 발생하는 원인과, 재시도·지수 백오프·지터·서킷 브레이커로 안정적으로 복구하는 방법을 정리합니다. Node.js와 Python 예제로 즉시 적용 가능한 패턴을 제공합니다.Read more →
Published on2026년 2월 14일파이썬 ONNX Runtime로 BERT 3배 경량·고속화aiPyTorch BERT를 ONNX Runtime으로 변환하고 그래프 최적화·동적 양자화·I/O 바인딩까지 적용해 CPU 추론을 3배 수준으로 경량·고속화하는 실전 튜닝을 정리합니다.Read more →
Published on2026년 2월 14일Qdrant RAG 성능 2배 - HNSW 튜닝 체크리스트aiQdrant에서 RAG 검색 지연을 줄이고 recall을 유지(또는 개선)하기 위한 HNSW 튜닝 체크리스트를 정리합니다. m, ef_construct, ef_search, 샤딩/필터, 메모리·디스크 옵션까지 실전 관점으로 다룹니다.Read more →