Published on2026년 1월 8일PyTorch 2.2+ PT2E로 INT8 양자화 Edge 최적화aiPyTorch 2.2+의 PT2E 기반 INT8 양자화 흐름을 정리하고, Edge 환경에서 성능과 정확도를 함께 챙기는 실전 체크리스트와 코드 예제를 제공합니다.Read more →
Published on2026년 1월 8일PyTorch 2.x PTQ로 int8 양자화해 4배 경량화aiPyTorch 2.x의 PTQ(Post-Training Quantization)로 FP32 모델을 int8로 양자화해 메모리 사용량을 크게 줄이고 CPU 추론 성능을 끌어올리는 실전 절차를 정리합니다.Read more →
Published on2026년 1월 8일RAG 성능 2배 - Qdrant HNSW 튜닝 실전aiQdrant의 HNSW 파라미터를 실제 RAG 트래픽 기준으로 튜닝해 검색 지연을 낮추고 recall을 유지하는 방법을 정리합니다. 인덱싱·서치·메모리·운영 관점의 체크리스트와 재현 가능한 실험 코드를 제공합니다.Read more →
Published on2026년 1월 8일Rust 소유권 - E0502/E0499 대출 충돌 해결syntaxRust에서 자주 마주치는 E0502/E0499는 동시에 빌릴 수 없는 참조 규칙을 어겼다는 신호입니다. 원인을 빠르게 분류하고, 스코프 분리·재구조화·내부 가변성 등 실전 해결 패턴을 코드로 정리합니다.Read more →
Published on2026년 1월 8일Self-Consistency CoT - k샘플·투표로 정답률 올리기aiChain-of-Thought를 한 번만 생성하지 말고 k번 샘플링한 뒤 자기일관성(Self-Consistency) 투표로 최종 답을 고르면, 추론 정확도를 안정적으로 끌어올릴 수 있습니다. 구현 패턴, k/temperature 튜닝, RAG 결합 시 주의점을 실전 관점에서 정리합니다.Read more →