SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

최신 AI 도구7개월 전에 게시 됨 Sharenet.ai
1.1K 0
Trae

일반 소개

SFT-data-builder 是一个开源项目,旨在利用免费的大模型API结合用户的私域数据生成高质量的SFT训练数据。该工具支持多种AI模型格式,并提供一键生成、批量生成、灵活编辑和本地存储等功能,帮助用户快速生成适用于预训练、微调、功能调用等场景的训练数据。

SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

 

SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

 

기능 목록

  • 一键生成训练数据:支持众多OpenAI格式调用的本地或云端模型。
  • 批量生成:一次生成多条不同角度的训练数据,支持批量URL文章自动生成数据。
  • 灵活编辑:所有生成的数据都可以随时编辑和调整。
  • 本地存储:自动保存所有数据到本地。
  • 导出简单:一键导出标准格式JSON文件。
  • 다중 모델 지원:支持多种主流AI模型,可自定义模型。
  • 멀티 포맷 지원:支持PDF、Word、TXT等多种文件格式。

 

도움말 사용

설치 프로세스

  1. 종속성 설치:在项目目录下运行 npm install.
  2. 프로젝트 시작: 실행 npm run start 프로젝트 시작하기.

사용 가이드라인

  1. 配置API::
    • 点击“打开配置”按钮。
    • 设置API地址和密钥。
    • 选择或自定义AI模型。
    • 设置每次生成的数据条数。
  2. 입력::
    • 上传文件(支持PDF、DOCX、TXT)。
    • 或直接输入文本内容。
  3. 生成数据::
    • 点击“生成AI响应”按钮。
    • 在多个生成结果中切换,根据需要编辑生成的内容。
  4. 管理数据::
    • 添加到数据列表。
    • 预览所有生成的数据。
    • 删除不需要的数据。
    • 导出为JSON文件。

기능 작동 흐름

  1. 一键生成训练数据::
    • 选择或自定义AI模型。
    • 输入或上传文本内容。
    • 点击“生成AI响应”按钮,系统会自动生成训练数据。
  2. 批量生成::
    • 在配置页面设置批量生成参数。
    • 上传包含多个URL的文件或输入多个URL。
    • 点击“批量生成”按钮,系统会自动生成多条训练数据。
  3. 灵活编辑::
    • 在生成结果页面,点击需要编辑的数据条目。
    • 在编辑器中修改内容,保存更改。
  4. 本地存储和导出::
    • 所有生成的数据会自动保存到本地存储。
    • 在数据管理页面,选择需要导出的数据,点击“导出为JSON”按钮。
© 저작권 정책
AiPPT

관련 문서

댓글 없음

없음
댓글 없음...