All Posts

  • Published on
    AutoGPT류 에이전트가 장기 대화·작업 기록을 쌓다가 컨텍스트가 터지는 문제를 벡터DB와 요약 파이프라인으로 제어하는 7단계 전략을 정리합니다. 비용·정확도·회수율을 동시에 잡는 실전 구성과 코드 예제를 제공합니다.
  • Published on
    GitHub Actions에서 403 권한 오류가 날 때 대부분은 GITHUB_TOKEN 권한 스코프가 부족해서 발생합니다. 워크플로우/리포지토리 설정에서 필요한 permissions를 명시하고, 경우에 따라 PAT·Deploy Key·OIDC로 대체하는 방법까지 정리합니다.
  • Published on
    KServe로 GPU 추론을 운영할 때 Cold Start가 길어지는 대표 원인 3가지를 구조적으로 분해합니다. 원인별 체크 포인트와 즉시 적용 가능한 완화 설정, 그리고 실전 디버깅 절차를 함께 정리합니다.