Published on2026년 1월 12일OpenAI Responses API 500·503 대응 재시도 폴백 서킷브레이커aiOpenAI Responses API에서 500/503 서버 오류가 발생할 때 지수 백오프 재시도, 폴백 모델/경로, 서킷브레이커로 장애를 흡수하는 실전 패턴을 코드로 정리합니다.Read more →
Published on2026년 1월 12일PostgreSQL pgvector RAG 검색 품질 급락 원인과 해결 체크리스트aipgvector로 RAG를 구축했는데 Recall@K가 갑자기 떨어진다면, 거리 함수 선택(cosine vs inner product), 벡터 정규화 누락, HNSW/IVFFlat 인덱스 파라미터 미스매치가 가장 흔한 원인입니다. 이 글은 현업 기준으로 재현 가능한 점검 순서와 튜닝 레시피를 제공합니다.Read more →
Published on2026년 1월 12일PyTorch INT8 양자화 후 정확도 급락 해결 7단계aiPyTorch INT8 양자화 후 정확도가 급락할 때, 원인을 빠르게 분리하고 재현 가능한 방식으로 복구하는 7단계 점검 절차를 정리합니다.Read more →
Published on2026년 1월 12일RAG 정확도 폭락? Milvus HNSW 튜닝 7가지aiRAG 정확도가 갑자기 떨어질 때 Milvus HNSW에서 가장 먼저 의심해야 할 튜닝 포인트 7가지를 정리합니다. recall과 latency를 함께 안정화하는 실전 체크리스트와 코드 예제를 제공합니다.Read more →
Published on2026년 1월 12일RAG 환각 줄이기 - LlamaIndex+Weaviate 리랭킹 튜닝aiLlamaIndex와 Weaviate를 조합한 RAG에서 환각을 줄이기 위한 리랭킹 전략과 튜닝 포인트를 정리합니다. 검색-리랭크-생성 파이프라인을 계측하고 파라미터를 조정해 근거 기반 답변 비율을 높입니다.Read more →