Published on2026년 2월 21일PyTorch PT2E 양자화로 INT8 모델 배포하기aiPyTorch 2의 PT2E(Post Training 2 export) 기반 양자화로 FP32 모델을 INT8로 변환하고, export-Compile-Deploy 파이프라인까지 실전 관점에서 정리합니다.Read more →
Published on2026년 2월 21일RAG용 Qdrant HNSW 튜닝 실전 가이드aiQdrant의 HNSW 파라미터를 RAG 품질·지연시간·비용 관점에서 튜닝하는 실전 절차를 정리합니다. 인덱스/서치 설정, 필터 조합, 측정 지표와 재현 가능한 실험 코드까지 포함합니다.Read more →
Published on2026년 2월 21일React 19 RSC 캐시 꼬임? 상태·렌더링 분리 전략techReact 19와 RSC 환경에서 ‘캐시가 꼬였다’고 느껴지는 증상은 대개 상태(클라이언트)와 렌더링(서버) 경계를 흐린 설계에서 시작됩니다. 캐시 키·재검증·서버 액션·클라이언트 상태를 분리해 예측 가능한 데이터 흐름을 만드는 방법을 정리합니다.Read more →
Published on2026년 2월 21일Spring Boot 3 Redis 세션 병목 - Lettuce 튜닝techSpring Boot 3에서 Redis 기반 세션(Spring Session) 사용 시 발생하는 병목을 Lettuce 관점에서 진단하고, 커넥션 풀·타임아웃·이벤트루프·명령 큐(backpressure) 튜닝으로 지연과 타임아웃을 줄이는 실전 가이드를 정리합니다.Read more →
Published on2026년 2월 20일Assistants·LangChain로 RAG 없이 챗봇 고도화aiRAG(검색 기반 생성) 없이도 OpenAI Assistants와 LangChain을 조합하면 도구 호출, 상태 관리, 구조화 출력으로 챗봇 품질을 크게 끌어올릴 수 있습니다. 운영 관점의 레이트리밋 대응과 안전한 출력 강제까지 함께 정리합니다.Read more →