Published on2026년 1월 17일LangChain 에이전트 툴콜링 무한루프 7원인aiLangChain 에이전트가 툴 호출을 멈추지 못하고 무한루프에 빠지는 대표 원인 7가지를 정리합니다. 재현 패턴, 로그 포인트, 프롬프트·스키마·상태관리·가드레일로 끊는 실전 처방을 함께 제공합니다.Read more →
Published on2026년 1월 17일로컬 LLM OOM·속도 해결 - bitsandbytes+KV 캐시ai로컬에서 LLM을 돌리다 OOM이 나거나 생성 속도가 너무 느릴 때, bitsandbytes 4/8bit 양자화와 KV 캐시 최적화로 VRAM을 줄이고 TPS를 끌어올리는 실전 방법을 정리합니다.Read more →
Published on2026년 1월 17일Milvus HNSW 튜닝으로 recall·latency 최적화aiMilvus에서 HNSW 인덱스를 사용할 때 recall과 latency를 동시에 만족시키기 위한 핵심 파라미터(M, efConstruction, efSearch)와 실전 튜닝 절차를 정리합니다.Read more →
Published on2026년 1월 17일MySQL 8.0 쓰기폭증 - REDO 로그·버퍼풀 튜닝techMySQL 8.0에서 갑자기 쓰기 IOPS가 폭증하거나 지연이 튀는 상황을 REDO 로그와 버퍼풀 관점에서 진단하고, 재현 가능한 튜닝 절차와 안전한 변경 순서를 정리합니다.Read more →
Published on2026년 1월 17일OpenAI+LangChain 스트리밍 중복 토큰 버그 해결aiOpenAI와 LangChain을 스트리밍으로 연결할 때 발생하는 중복 토큰(문장 반복) 문제의 원인과 재현, 그리고 콜백/버퍼/전송 레이어별 실전 해결책을 정리합니다.Read more →