All Posts

  • Published on
    Redis QPS가 갑자기 폭주할 때 흔한 원인인 핫키를 5분 안에 진단하는 체크리스트를 정리했습니다. LFU 기반 관찰과 즉시 적용 가능한 완화책까지 실전 커맨드로 설명합니다.
  • Published on
    TorchServe 운영에서 가장 자주 터지는 503, OOMKilled, 워커 과부하를 로그·지표·설정 관점으로 빠르게 진단하고, 모델/컨테이너/워커 파라미터를 실전적으로 튜닝하는 방법을 정리합니다.
  • Published on
    Triton Inference Server에서 모델을 무중단으로 교체(핫스왑)하려다 실패하는 대표 원인과 로그 기반 진단법을 정리합니다. 모델 레포지토리 구조, versioning, config.pbtxt, 메모리/리소스 이슈까지 재현 가능한 해결 절차를 제공합니다.
  • Published on
    AutoGPT에 MCP(Model Context Protocol)를 붙여 외부 도구를 표준 방식으로 연결하고, 실행 권한을 격리하는 아키텍처를 정리합니다. 실전에서 필요한 권한 스코프, 샌드박싱, 감사 로그, 실패·재시도 패턴까지 코드로 설명합니다.