Published on2026년 1월 26일Transformers 로컬 LLM 느림? FlashAttention2 적용ai로컬에서 Transformers로 LLM 추론이 느릴 때 FlashAttention2로 속도를 끌어올리는 실전 적용 가이드. 설치, 로딩 옵션, 흔한 에러와 VRAM 이슈까지 한 번에 정리합니다.Read more →
Published on2026년 1월 26일Weaviate Hybrid Search RAG 튜닝 - BM25·벡터 가중치aiWeaviate Hybrid Search에서 BM25와 벡터 스코어를 어떻게 섞고, RAG 품질을 떨어뜨리는 케이스를 어떻게 계측·튜닝하는지 실전 관점으로 정리합니다.Read more →
Published on2026년 1월 25일K8s ImagePullBackOff - ECR 403·토큰 만료 해결techECR에서 403, 토큰 만료로 인해 Kubernetes가 이미지를 못 받아 ImagePullBackOff가 발생할 때의 원인 분류와 재현 가능한 해결 절차를 정리합니다.Read more →
Published on2026년 1월 25일LangChain+OpenAI로 RAG 환각 줄이는 평가 자동화aiLangChain과 OpenAI를 조합해 RAG 답변의 환각을 정량화하고, 회귀 테스트처럼 자동 평가 파이프라인을 구축하는 방법을 정리합니다. 근거 일치성·인용 품질·거절 정확도를 중심으로 실무형 지표와 코드까지 제공합니다.Read more →
Published on2026년 1월 25일리눅스 OOM Killer로 프로세스 죽을 때 원인 추적tech리눅스에서 프로세스가 갑자기 죽고 로그에 OOM Killer 흔적이 남을 때, 커널 로그부터 cgroup 메모리 제한까지 원인을 재현 가능하게 추적하는 방법을 정리합니다.Read more →