All Posts

  • Published on
    LangChain v0.2에서 기존 Memory 패턴이 약해진 이후에도 대화 상태를 안정적으로 유지하는 방법을 정리합니다. RunnableWithMessageHistory, 체크포인터, 외부 저장소를 조합해 실서비스에 맞는 설계를 제안합니다.
  • Published on
    Self-Consistency는 CoT를 여러 번 샘플링해 최빈 답을 선택함으로써 추론 정답률을 올리는 기법입니다. 구현 패턴, 하이퍼파라미터, 비용·지연 트레이드오프와 운영 팁까지 정리합니다.
  • Published on
    OpenAI Responses API에서 API 키가 맞는데도 401이 나는 경우는 ‘키 문자열’ 자체보다 프로젝트/권한/헤더/프록시/엔드포인트 불일치에서 더 자주 발생합니다. 실제 운영에서 많이 밟는 7가지 원인과 재현·점검·해결 방법을 코드와 함께 정리합니다.