분석 GBI(XiYan-SQL): 간편한 ChatBI를 위한 텍스트-SQL 지능형 데이터 분석
일반 소개
Analytics GBI는 알리윈 바이리안이 출시한 빅데이터 모델 기반의 지능형 데이터 분석 제품입니다. 이 제품은 고급 자연어 처리 기술을 사용하여 사용자가 복잡한 SQL 구문을 숙지하지 않고도 자연어를 통해 데이터를 쿼리하고 분석할 수 있도록 도와줍니다. Analytics GBI는 MySQL, PostgreSQL 프로토콜 데이터베이스, Excel 파일 등 다양한 데이터 소스를 지원하며, 퍼블릭 클라우드 및 하이브리드 배포 모델을 지원하는 유연한 배포 옵션을 제공합니다. 다중 지능 바디 프레임워크는 작업 복잡도에 따라 여러 지능을 동적으로 예약하여 작업을 수행할 수 있으며, 효율적인 데이터 분석과 지능형 차트 시각화 기능을 제공하여 사용자의 의사 결정 효율성과 데이터 인사이트 역량을 향상시킵니다.
추천 오픈 소스 제품:DB-GPT: 멀티 모델 관리와 지능형 데이터 처리를 통합하는 AI 네이티브 데이터 애플리케이션 개발 프레임워크 구축
XiYan-SQL: 텍스트에서 SQL로 변환하기 위한 다중 생성기 통합 프레임워크
자연어에서 SQL 작업까지 대규모 언어 모델의 성능 문제를 해결하기 위해 다중 생성기 통합 전략을 사용하여 후보 생성을 개선하는 혁신적인 프레임워크인 XiYan-SQL을 제안합니다. 데이터베이스 구조에 대한 이해를 높이기 위한 반구조적 스키마 표현인 M-Schema를 소개합니다. 생성된 후보 SQL 쿼리의 품질과 다양성을 향상시키기 위해 XiYan-SQL은 상황 내 학습(ICL)의 놀라운 잠재력과 감독 미세 조정의 정밀한 제어를 결합합니다. 한편으로는 다양한 선호도를 가진 고품질 후보를 생성하기 위해 모델을 미세 조정하기 위한 일련의 학습 전략을 제안합니다. 다른 한편으로는 명명된 개체 인식에 기반한 예제 선택 방법을 구현하여 ICL 접근 방식에서 개체에 대한 지나친 강조를 방지합니다. 리파이너는 논리 또는 구문 오류를 수정하여 각 후보 항목을 최적화합니다. 최적의 후보를 식별하는 문제를 해결하기 위해 선택 모델을 미세 조정하여 후보 SQL 쿼리의 미묘한 차이를 구분합니다. 여러 방언 데이터 세트에 대한 실험 결과에 따르면 XiYan-SQL은 다양한 시나리오에서 문제를 해결하는 데 있어 강력한 견고성을 보여줍니다. 전반적으로, 우리가 제안한 XiYan-SQL은 Spider 테스트 세트에서 89.65%, SQL-Eval에서 69.86%, NL2GQL에서 41.20%의 경쟁 실행 정확도를 달성했으며, Bird 개발 벤치마크에서는 72.23%의 점수를 기록했습니다. 이 프레임워크는 SQL 쿼리의 품질과 다양성을 향상시킬 뿐만 아니라 이전 접근 방식보다 성능이 뛰어납니다.
출처 : https://github.com/XGenerationLab/XiYan-SQL

기능 목록
- 자연어 대화SQL 구문을 숙지하지 않고도 자연어를 통해 데이터를 쿼리하고 분석할 수 있습니다.
- 여러 데이터 소스 지원MySQL, PostgreSQL 프로토콜 데이터베이스 및 Excel 파일 도킹을 지원합니다.
- 지능형 작업 예약다중 지능형 바디 프레임워크는 작업 복잡도에 따라 작업 실행을 동적으로 예약합니다.
- 지능형 차트 시각화데이터 특성을 기반으로 지능형 차트를 생성하여 분석 결과를 시각적으로 표시합니다.
- 비즈니스 로직에 대한 설명빅 모델이 비즈니스 시나리오를 이해할 수 있도록 유연한 비즈니스 논리 해석 기능을 제공합니다.
- 데이터 테이블 관리데이터 테이블 정보를 관리하여 쿼리 정확도를 개선합니다.
- 사례집 자체 운영사례 관리를 통해 모델 자가 학습을 유도하여 모델 효과를 최적화합니다.
- 보안 배포데이터 보안을 위한 퍼블릭 클라우드 및 하이브리드 배포 모델을 지원합니다.
도움말 사용
설치 및 구성
- 등록 및 로그인액세스다이얼렉틱스 GBI 공식 웹사이트를 클릭하고 알리클라우드 계정으로 등록하고 로그인합니다.
- 프로젝트 만들기로그인한 후 콘솔에 들어가서 '프로젝트 만들기'를 클릭하고 프로젝트 이름과 설명을 입력한 다음 데이터 소스 유형을 선택합니다.
- 데이터 원본에 연결선택한 데이터 소스 유형에 따라 해당 연결 정보(예: 데이터베이스 URL, 사용자 이름, 비밀번호 등)를 입력하여 데이터 소스 연결을 완료합니다.
- 인텔리전트 바디 구성프로젝트 설정에서 지능의 작업 일정 및 실행 전략을 구성하고 적절한 지능 모델을 선택합니다.
- 배포 및 테스트: 구성을 완료한 후 "배포"를 클릭하면 시스템이 자동으로 배포됩니다. 배포가 완료되면 콘솔을 통해 테스트하여 구성이 올바른지 확인할 수 있습니다.
사용 가이드라인
- 자연어 쿼리콘솔 입력란에 "2023년 매출 데이터 쿼리"와 같은 자연어 쿼리문을 입력하면 시스템이 자동으로 SQL을 생성하여 쿼리 결과를 반환합니다.
- 지능형 차트 생성쿼리 결과 페이지에서 '차트 생성'을 클릭하면 시스템이 데이터 특성에 따라 해당 차트를 자동으로 생성하며, 사용자는 다양한 차트 유형을 선택하여 표시할 수 있습니다.
- 다자간 대화 지원이 시스템은 사용자가 쿼리 과정에서 질문을 추가, 수정 또는 후속 질문을 할 수 있는 다방향 대화를 지원하며, 시스템은 상황에 따라 지능적으로 응답합니다.
- 비즈니스 로직에 대한 설명쿼리 프로세스 중에 사용자가 비즈니스 로직 설명을 추가하여 시스템이 쿼리 의도를 더 정확하게 이해할 수 있도록 도울 수 있습니다.
- 사례 라이브러리 관리사례 라이브러리에서 사례를 추가, 수정 및 관리하여 자가 학습을 위한 사례를 통해 모델을 안내하고 모델의 정확성과 효율성을 향상시킬 수 있습니다.
- 데이터 테이블 관리콘솔의 '데이터 테이블 관리' 모듈에서 사용자는 테이블 구조, 열 정보 등을 포함한 데이터 테이블 정보를 보고 관리하여 시스템이 쿼리 문제를 보다 정확하게 파악할 수 있도록 지원합니다.
- 보안 설정프로젝트 설정에서 사용자는 VPC 액세스, 데이터 암호화 등을 포함한 데이터 보안 정책을 구성하여 데이터 전송 및 저장의 보안을 보장할 수 있습니다.
일반적인 문제
- 데이터베이스 연결 오류URL 형식이 올바른지 확인하고, URL이 공용 네트워크 접근 가능한 주소인지 확인하고, 데이터베이스 접근 IP 제한을 확인하고, 다이얼렉틱 GBI의 공용 네트워크 IP가 화이트리스트에 있는지 확인합니다.
- 조회 결과 불량복잡한 문제를 여러 개의 간단한 문제로 분할, 데이터 테이블 표현 및 스키마 정보 추가, 비즈니스 논리 설명 추가, 최적화를 위한 사례 추가.
- 날짜 서식 오류: 열 설명에 날짜 형식을 표시하고 YYYY-MM-DD 형식을 사용하는 것이 좋습니다.
© 저작권 정책
이 글은 저작권이 있으며 무단으로 복제해서는 안 됩니다.
관련 문서
댓글 없음...