Published on2026년 2월 2일AutoGPT 메모리 폭주? 벡터DB+요약압축 튜닝aiAutoGPT가 오래 돌수록 메모리가 비대해지고 비용이 폭증하는 문제를 벡터DB 설계와 요약 압축 전략으로 제어하는 방법을 정리합니다. 검색 품질을 유지하면서 토큰·지연·저장 비용을 낮추는 실전 튜닝 포인트를 다룹니다.Read more →
Published on2026년 2월 2일AutoGPT 루프 폭주 막는 메모리·가드레일 설계aiAutoGPT 같은 에이전트가 무한 루프·과금 폭주·도구 남용으로 망가지는 원인을 분석하고, 메모리 설계와 실행 가드레일로 안정적으로 제어하는 구현 패턴을 정리합니다.Read more →
Published on2026년 2월 2일ComfyUI VRAM 폭발? 타일·VAE로 해결하기aiComfyUI에서 고해상도 생성 중 VRAM이 터지는 원인을 분해하고, 타일링과 VAE 설정만으로 메모리를 안정화하는 실전 노드를 정리합니다.Read more →
Published on2026년 2월 2일ComfyUI 워크플로 JSON 깨짐 복구 실전aiStable Diffusion ComfyUI에서 워크플로 JSON이 깨졌을 때(파싱 실패, 일부 잘림, 인코딩 문제) 빠르게 복구하는 방법을 정리했습니다. 원인 진단부터 자동 복구 스크립트, 재발 방지 체크리스트까지 다룹니다.Read more →
Published on2026년 2월 2일로컬 LLM 속도 2배 만들기 - vLLM vs TGIaiTransformers 기반 로컬 LLM 서빙에서 체감 속도를 2배 끌어올리는 핵심은 엔진 선택과 배치 전략입니다. vLLM과 TGI를 같은 조건으로 비교하고, 실제 운영 튜닝 포인트를 정리합니다.Read more →