Published on2026년 1월 31일CoT 누출 막기 - Responses API로 요약만 받기ai체인 오브 쏘트(CoT) 노출을 줄이면서도 품질 좋은 결과를 받는 핵심은 ‘추론은 내부로, 출력은 요약으로’입니다. OpenAI Responses API에서 요약 전용 출력 패턴과 서버 측 가드레일을 조합해 CoT 누출 리스크를 낮추는 방법을 정리합니다.Read more →
Published on2026년 1월 31일CoT 대신 DPO·RLAIF로 프롬프트 튜닝하기aiCoT를 노출하지 않고도 모델의 추론 품질을 끌어올리는 DPO·RLAIF 기반 튜닝 전략을 정리합니다. 데이터 설계부터 학습 파이프라인, 운영 시 안전장치까지 실전 관점으로 다룹니다.Read more →
Published on2026년 1월 31일파이썬 ONNX Runtime로 CNN 10배 경량화·가속aiPyTorch CNN을 ONNX로 내보내고 ONNX Runtime에서 FP16·INT8 양자화와 실행 옵션 튜닝으로 지연시간과 메모리를 크게 줄이는 실전 가이드입니다.Read more →
Published on2026년 1월 31일Rust+Tantivy로 RAG 검색속도 3배 튜닝aiRust와 Tantivy로 RAG의 1차 후보 검색(lexical)을 최적화해 P95 지연을 3배 가까이 줄이는 튜닝 포인트를 정리합니다. 인덱스 설계, 쿼리 구조, 캐시·병렬화·세그먼트 병합까지 실전 코드로 설명합니다.Read more →
Published on2026년 1월 31일systemd 서비스 자동 재시작 - 죽었다 깨도 복구syntaxsystemd의 Restart 정책과 watchdog, 백오프, 헬스체크 스크립트를 조합해 서비스가 어떤 형태로 죽어도 자동 복구되도록 구성합니다. 장애 루프를 막는 제한과 관측(journalctl)까지 함께 정리합니다.Read more →