Published on2026년 1월 3일Gemini API 400 Invalid Argument - 안전필터·스키마 오류aiGemini API 호출에서 자주 마주치는 400 Invalid Argument를 안전 필터(콘텐츠 정책)와 JSON 스키마/요청 스펙 오류 관점에서 분해해 재현·진단·수정하는 실전 가이드입니다.Read more →
Published on2026년 1월 3일GitHub Actions로 Docker 빌드캐시 5배 가속techGitHub Actions에서 Docker BuildKit과 cache-to/cache-from를 제대로 쓰면 이미지 빌드 시간을 체감 5배까지 줄일 수 있습니다. GHA 캐시, 레지스트리 캐시, 멀티스테이지 최적화까지 실전 설정을 정리합니다.Read more →
Published on2026년 1월 3일KServe+Knative로 GPU 모델 무중단 롤아웃aiKServe InferenceService와 Knative 트래픽 분할을 활용해 GPU 모델을 무중단으로 롤아웃하는 방법을 정리합니다. 카나리/블루그린, 워밍업, 오토스케일, 롤백까지 운영 관점 체크리스트와 예제를 제공합니다.Read more →
Published on2026년 1월 3일KServe+Knative로 LLM 추론 오토스케일·카나리aiKServe와 Knative를 조합해 LLM 추론 서비스를 자동 확장하고, 트래픽 분할 기반 카나리 배포로 안전하게 모델을 교체하는 실전 패턴을 정리합니다.Read more →
Published on2026년 1월 3일LangChain에서 OpenAI 429 폭주 막는 배치·백오프·캐시aiLangChain 사용 중 OpenAI 429(Rate limit) 폭주를 배치 처리, 지수 백오프, 캐시로 안정화하는 실전 패턴을 정리합니다. 운영 환경에서 재시도 폭탄을 막는 설계 체크리스트와 코드 예제를 제공합니다.Read more →