Published on2026년 2월 3일KServe·KFServing GPU 추론 429·OOM 해결 가이드aiKServe(KFServing)에서 GPU 추론 중 429(과부하)와 OOM(메모리 부족)을 재현·진단·해결하는 실전 체크리스트를 정리합니다. 큐잉/동시성/오토스케일과 GPU 메모리 모델을 함께 튜닝하는 방법을 제공합니다.Read more →
Published on2026년 2월 3일LangChain RAG 환각 줄이기 - Citations 강제aiLangChain 기반 RAG에서 환각을 줄이는 가장 실전적인 방법은 답변을 ‘출처가 있는 문장’으로만 생성하게 강제하는 것입니다. 이 글은 citations 스키마 설계부터 검증·재시도·UI 노출까지 end-to-end 패턴을 코드로 정리합니다.Read more →
Published on2026년 2월 3일LangChain 도구호출 무한루프 끊는 6가지 패턴aiLangChain 에이전트가 같은 도구를 반복 호출하며 멈추지 않는 문제를 6가지 실전 패턴으로 끊습니다. 원인 진단부터 코드 레벨 가드레일까지 한 번에 정리합니다.Read more →
Published on2026년 2월 3일리눅스 cron 미실행? PATH·메일로그·권한 점검techcron이 분명 등록돼 있는데 실행이 안 될 때는 환경변수(PATH), 출력/에러 로그(메일·syslog), 실행 권한/소유자 문제부터 의심해야 합니다. 재현 가능한 점검 순서와 안전한 수정 패턴을 정리합니다.Read more →
Published on2026년 2월 3일Pinecone 메타데이터 필터가 느릴 때 인덱스 설계aiPinecone에서 메타데이터 필터가 느려지는 대표 원인과, 인덱스/네임스페이스/메타데이터 스키마를 어떻게 설계해야 지연을 줄일 수 있는지 실전 관점에서 정리합니다.Read more →