01Overview

비공개 고객/실무 PoC를 비식별화한 case study입니다. 고객지원 RAG 챗봇을 stakeholder 데모와 연동 논의를 위해 callbot 호환 동기식 JSON API로 변환했습니다.

02Context

원본 저장소가 비공개이므로, 이 공개 case study에서는 고객명, 비공개 endpoint, 원본 로그, 스크린샷, 직접적인 GitHub 링크를 의도적으로 제외했습니다.

03Business Problem

이해관계자에게는 RAG 응답 workflow가 웹 채팅 UI뿐 아니라 callbot 형태의 고객지원 시나리오에도 맞출 수 있는지를 보여줄 필요가 있었습니다.

04Role Scope

RAG workflow를 API PoC로 변환하고, 데모 흐름을 정리했으며, 검증 근거를 패키징하고, pre-sales 대화를 위해 한계를 솔직하게 정리했습니다.

05Solution Direction

RAG core를 중심으로 동기식 JSON API를 노출하고, conversation ID를 유지하며, exact/similar/golden cache 경로를 추가하고, callbot 형태의 응답 metadata를 반환하도록 구성했습니다.

06Architecture

Callbot-style request -> API-key guarded FastAPI route -> cache paths -> retrieval/answer generation -> response adapter -> benchmark notes.

07Implementation

이 PoC는 FastAPI API layer, RAG retrieval, 응답 caching, query logging, callbot 호환 응답 정형화를 사용했습니다. 운영 단계의 telephony 인프라로 설명해서는 안 됩니다.

08Demo Scenario

고객이 문제 해결 메시지를 보내면 대화 연속성이 유지된 구조화된 봇 응답을 받고, 검토자는 지연/캐시 동작과 답변 적합성을 함께 확인합니다.

09Deliverables

Callbot-compatible API PoC, RAG response flow, cache behavior notes, benchmark summary, and private-safe portfolio case study.

10Impact

샘플 벤치마크 노트는 데모 논의를 위해 답변 적합성을 PoC 수준에서 보수적으로 가늠하게 해주며, 동시에 출처/URL 정확도와 콜드 레이턴시의 한계도 함께 기록합니다. 프로덕션 기준의 벤치마크 결과나 지연·정확도 수치는 주장하지 않습니다.

11Risk & Trade-off

답변 적합성, 출처 정확도, 콜드 레이턴시, 웜/캐시 레이턴시, multi-turn 동작은 각각 분리해서 보고해야 합니다. 이를 하나로 뭉뚱그리면 PoC를 과장하게 됩니다.

12Consulting Takeaway

가치는 PoC를 운영 준비가 끝난 것처럼 포장하는 데 있지 않고, 동작하는 연동 경로와 검증 근거, 다음 구현 로드맵을 이해관계자에게 보여주는 데 있습니다.

이 사례의 전체 맥락이 궁금하시면, 이야기 나눠요.
gkwoghks96@gmail.com