Published on2025년 12월 30일Pinecone·Milvus 임베딩 Drift 탐지와 재인덱싱ai벡터DB 운영에서 임베딩 Drift를 조기에 감지하고, Pinecone·Milvus에서 안전하게 재인덱싱하는 실전 절차를 정리합니다. 지표 설계, 샘플링·카나리, 듀얼 인덱스 전환, 롤백까지 포함합니다.Read more →
Published on2025년 12월 30일Pinecone·Milvus 하이브리드검색 튜닝 실전aiPinecone과 Milvus에서 하이브리드 검색(벡터+키워드)을 실전 관점으로 튜닝하는 방법을 정리합니다. 스코어 결합, 인덱스 파라미터, 리랭킹, 운영 지표까지 한 번에 다룹니다.Read more →
Published on2025년 12월 30일PyArrow Invalid - UTF-8 디코딩 오류 해결 가이드techPyArrow에서 발생하는 Invalid - UTF-8 디코딩 오류의 원인(스키마, 인코딩, 바이너리/문자열 혼재, Parquet/CSV 손상)을 빠르게 분류하고, 재현·진단·해결까지 실전 코드로 정리합니다.Read more →
Published on2025년 12월 30일PyTorch 2 Export+TensorRT로 LLM FP8 압축aiPyTorch 2의 export 기반 그래프 캡처와 TensorRT-LLM FP8 양자화를 결합해 LLM을 더 작고 빠르게 서빙하는 실전 절차를 정리합니다. 흔한 실패 지점과 검증 포인트, 재현 가능한 코드까지 포함합니다.Read more →
Published on2025년 12월 30일RAG 환각 잡는 하이브리드 검색 튜닝 - BM25+벡터aiRAG에서 환각이 늘어나는 핵심 원인 중 하나는 검색 단계의 누락과 오탐입니다. BM25+벡터 하이브리드 검색을 점수 결합, 필터, 쿼리 튜닝 관점에서 실전적으로 최적화하는 방법을 정리합니다.Read more →