Published on2026년 1월 29일Pinecone·Milvus 임베딩 차원 불일치 해결 가이드aiPinecone와 Milvus에서 가장 흔한 장애 중 하나인 임베딩 차원 불일치의 원인과 재현, 그리고 운영 환경에서 안전하게 해결하는 마이그레이션 전략을 정리합니다.Read more →
Published on2026년 1월 29일PostgreSQL VACUUM 안 돌아갈 때 - autovacuum 튜닝techVACUUM이 안 도는 것처럼 보이거나 테이블 bloat가 계속 쌓일 때, autovacuum의 트리거·작업자·I/O 제한·락/트랜잭션 이슈를 체계적으로 점검하고 튜닝하는 방법을 정리합니다.Read more →
Published on2026년 1월 29일CoT 누출 막기 - JSON만 출력시키는 프롬프트aiLLM 응답에서 Chain-of-Thought(추론 과정) 누출을 줄이고, 항상 JSON만 출력하도록 강제하는 프롬프트/스키마/검증 파이프라인을 정리합니다.Read more →
Published on2026년 1월 29일파이썬 ONNX Runtime로 CNN INT8 양자화 튜닝aiONNX Runtime에서 대규모 CNN을 8bit(INT8)로 양자화할 때 정확도 하락을 최소화하고 지연시간을 줄이는 튜닝 절차를 파이썬 코드로 정리합니다.Read more →
Published on2026년 1월 29일PyTorch 2 Export+PT2E로 INT8 양자화 실전aiPyTorch 2의 Export 기반(PT2E) 양자화로 INT8 모델을 만드는 실전 흐름을 정리합니다. 캘리브레이션, 변환, 검증, 배포 시 함정까지 코드로 바로 따라할 수 있게 구성했습니다.Read more →