All Posts

  • Published on
    AutoGPT가 장시간 실행되며 메모리가 폭주하는 원인은 ‘무한 누적되는 장기기억(벡터DB) + 비싼 재검색’ 조합인 경우가 많습니다. TTL(만료)과 요약(압축)을 함께 적용해 비용·지연·정확도를 균형 있게 잡는 실전 패턴을 정리합니다.
  • Published on
    Gemini API 호출에서 400 INVALID_ARGUMENT가 발생할 때, 프롬프트 구조·요청 스키마·안전필터 트리거를 체계적으로 분리해 원인을 찾는 방법을 정리합니다. 재현 가능한 최소 요청부터 로그/리트라이/가드레일까지 실전 디버깅 체크리스트를 제공합니다.
  • Published on
    LangChain 기반 RAG에서 환각을 줄이려면 검색·컨텍스트·프롬프트·생성·후처리 전 구간에 평가와 가드레일을 걸어야 합니다. 이 글은 운영 환경에서 바로 적용 가능한 8단계 체크리스트와 코드 예제를 제공합니다.