Skip to content

[Week3] 클래식 공연 예습 RAG 구현#16

Open
daexvk wants to merge 1 commit into
mainfrom
daexvk/week3-domain-rag
Open

[Week3] 클래식 공연 예습 RAG 구현#16
daexvk wants to merge 1 commit into
mainfrom
daexvk/week3-domain-rag

Conversation

@daexvk

@daexvk daexvk commented Jun 6, 2026

Copy link
Copy Markdown
Collaborator

변경점 👍

  • 클래식 공연 예습 도메인용 week3 RAG 파이프라인을 구현했습니다.
  • assignments/daexvk/data/raw/*.txt에 Wikipedia 원문 기반 RAG 데이터 28개를 추가했습니다.
  • Loader -> Splitter -> Embed -> Store -> Retrieve 5단계를 직접 구성했습니다.
  • FAISS vector store를 사용했습니다.
  • 동일한 embedding 객체를 indexing/query 양쪽에 사용하도록 구성했습니다.
  • splitter 전략 2개를 구현하고 비교했습니다.
    • recursive_character
    • token
  • 비교 쿼리 3개 이상으로 splitter별 retrieval 결과 차이를 노트북에 정리했습니다.
  • 2-step RAG를 구현했습니다.
    • retrieve
    • generate
  • RAG 답변에 근거 문서 파일명과 chunk index를 함께 출력하도록 했습니다.
  • 테스트 질문 5개 이상을 구성했습니다.
    • 사실조회
    • 종합
    • 비교
    • 모호한 질문
    • 공연 예절

테스트 💻

  • week3_mission.ipynb에서 다음 항목을 확인했습니다.

    • raw 문서 28개 로드
    • recursive splitter chunk 생성
    • token splitter chunk 생성
    • FAISS vector store 생성
    • splitter별 retrieval 결과 비교
    • retrieve -> generate 2-step RAG 실행
    • 근거 문서 파일명 및 chunk index 출력
    • 테스트 질문 5개 실행
  • 로컬 검증:

    • week3_mission.ipynb JSON 유효성 확인
    • rag_pipeline.py AST syntax 확인
    • smoke test 결과:
      • loaded documents: 28
      • recursive chunks: 1158
      • token chunks: 861

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant