All Posts

  • Published on
    OpenAI Responses API 호출에서 504 Gateway Timeout이 발생하는 전형적인 경로(프록시/로드밸런서/클라이언트 타임아웃)를 재현하고, 스트리밍·타임아웃·재시도·폴백으로 안정화하는 실전 체크리스트를 정리합니다.
  • Published on
    SettingWithCopyWarning은 단순 경고가 아니라, 데이터가 조용히 안 바뀌는 실무 버그의 전조입니다. 경고가 뜨는 구조를 이해하고, .loc/.copy/assign/pipe로 안전한 패턴을 표준화해 버그를 0에 가깝게 줄입니다.
  • Published on
    PyTorch 2.0의 PT2E(Export) 기반 양자화 파이프라인으로 XNNPACK 백엔드에서 int8 모델을 만드는 방법을 정리합니다. 준비물, 코드, 흔한 함정과 성능/정확도 체크 포인트까지 실전 관점으로 다룹니다.