Dandy Now!
  • [ AI/AI와 일하기 ]
    [LLM] PDF 문서 파싱, LlamaParse vs. Unstructured.io: 당신의 RAG 시스템을 위한 최적의 선택은?
    2025-07-03 13:13:29
    PDF 문서 파싱, LlamaParse vs. Unstructured.io: 당신의 RAG 시스템을 위한 최적의 선택은?RAG(Retrieval-Augmented Generation) 시스템을 구축할 때, 가장 중요한 단계 중 하나는 원본 문서에서 정확하고 풍부한 정보를 추출하는 것이다. 특히 PDF 문서의 경우, 텍스트뿐만 아니라 표와 이미지와 같은 시각적 요소가 중요한 의미를 담고 있어, 이를 효과적으로 파싱하는 것이 핵심적인 과제이다.오늘은 PDF 파싱 분야에서 주목받는 두 가지 도구, LlamaParse와 Unstructured.io를 비교하여 당신의 RAG 시스템에 어떤 도구가 더 적합할지 알아보는 시간을 가질 것이다.1. LlamaParse: LLM 최적화 파싱의 선두주자LlamaIndex 팀..
  • [ AI/AI와 일하기 ]
    [LLM] PDF 멀티모달 RAG 구현을 위한 효과적인 기술 조합
    2025-07-03 13:06:27
    PDF 멀티모달 RAG 구현을 위한 효과적인 기술 조합PDF 문서에서 그림과 표와 같은 시각적 요소가 중요한 정보를 담고 있을 때, 이를 버리지 않고 RAG(Retrieval-Augmented Generation) 시스템에 효과적으로 활용하는 것은 고급 검색 및 답변 생성에 필수적인 부분이다. 텍스트와 시각적 데이터를 모두 벡터 데이터베이스에 저장하고 매핑하여 함께 검색될 수 있도록 하는 기술 조합은 다음과 같다.1. PDF 멀티모달 파싱 및 데이터 추출PDF 문서에서 텍스트뿐만 아니라 그림과 표를 정확하게 추출하는 것이 첫 번째 단계이다. 이 과정에서 시각적 레이아웃과 구조를 이해하는 전문 파싱 도구를 사용해야 한다.전문 PDF 파싱 도구 활용:LlamaParse: LlamaIndex에서 제공하는 이 ..