Published on2026년 2월 20일systemd 서비스가 재부팅 후 안 뜰 때 12단계 점검ai재부팅 후 systemd 서비스가 자동으로 올라오지 않을 때, 원인 분류부터 로그·유닛·의존성·권한·타이밍 이슈까지 12단계로 빠르게 진단하는 체크리스트입니다.Read more →
Published on2026년 2월 20일Transformers 로컬 LLM OOM 7분 진단·해결aiTransformers로 로컬 LLM을 돌리다 OOM이 날 때, 7분 안에 원인을 좁히고(가중치·KV 캐시·배치·파편화) 즉시 적용 가능한 해결책을 정리합니다.Read more →
Published on2026년 2월 20일Transformers 로컬 LLM OOM 해결 - 4bit+KV 캐시ai로컬에서 Transformers로 LLM을 돌릴 때 흔한 CUDA OOM을 4bit 양자화와 KV 캐시 최적화로 줄이는 실전 가이드입니다. 메모리 구조를 이해하고, 설정 조합별 트레이드오프까지 정리합니다.Read more →
Published on2026년 2월 19일AutoGPT 메모리 폭주·환각 줄이는 Qdrant 실전aiAutoGPT의 메모리 폭주와 환각을 줄이기 위해 벡터DB(Qdrant)를 Rust로 실전 적용하는 방법을 정리합니다. 인덱싱/검색/필터링/TTL까지 운영 관점의 튜닝 포인트를 다룹니다.Read more →
Published on2026년 2월 19일AutoGPT 메모리 누수? 벡터DB TTL·요약 전략aiAutoGPT가 오래 돌수록 비용과 응답 지연이 커지는 원인을 ‘메모리 누수처럼 보이는’ 벡터DB/대화 로그 적체로 보고, TTL·요약·계층형 메모리로 제어하는 실전 전략을 정리합니다.Read more →