Published on2026년 2월 3일PyTorch QAT로 INT8 양자화 정확도 하락 막기aiPyTorch QAT(Quantization Aware Training)로 INT8 양자화를 적용할 때 정확도 하락이 나는 핵심 원인과, 실제로 효과 있는 방지 전략(옵저버/페이크퀀트, fuse, per-channel, 학습 스케줄)을 코드로 정리합니다.Read more →
Published on2026년 2월 3일CoT 없이도 추론 강화 - ReAct·ToT 프롬프트 실전aiChain-of-Thought를 노출하지 않고도 모델의 추론 성능을 끌어올리는 ReAct·Tree-of-Thought 프롬프트를 실전 관점에서 정리합니다. 관찰-행동 루프, 후보 해 탐색, 평가 기준 설계까지 바로 적용 가능한 템플릿과 코드 예제를 제공합니다.Read more →
Published on2026년 2월 3일CoT 없이도 정확도↑ - Self-Consistency 구현법aiChain-of-Thought를 강제 노출하지 않고도, 여러 번 샘플링한 답을 합의로 모아 정확도를 올리는 Self-Consistency를 실전 구현 관점에서 정리합니다.Read more →
Published on2026년 2월 3일Spring Boot 3 가상스레드로 응답지연 잡는 실전 가이드techSpring Boot 3에서 가상스레드를 적용했는데도 응답 지연이 남는 이유는 대부분 블로킹 I/O, 풀 설정, 관측 포인트 부재에서 발생합니다. MVC/톰캣 기준으로 병목을 식별하고 안전하게 튜닝하는 방법을 정리합니다.Read more →
Published on2026년 2월 2일Assistants API+LangChain 툴콜 오류 디버깅 가이드aiOpenAI Assistants API와 LangChain을 함께 쓸 때 자주 터지는 툴콜 오류를 재현·관측·수정하는 실전 디버깅 절차를 정리합니다. 스키마 불일치, 멀티툴 호출, 타임아웃/재시도, 출력 검증까지 코드로 다룹니다.Read more →