SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成
일반 소개
SFT-data-builder 是一个开源项目,旨在利用免费的大模型API结合用户的私域数据生成高质量的SFT训练数据。该工具支持多种AI模型格式,并提供一键生成、批量生成、灵活编辑和本地存储等功能,帮助用户快速生成适用于预训练、微调、功能调用等场景的训练数据。


기능 목록
- 一键生成训练数据:支持众多OpenAI格式调用的本地或云端模型。
- 批量生成:一次生成多条不同角度的训练数据,支持批量URL文章自动生成数据。
- 灵活编辑:所有生成的数据都可以随时编辑和调整。
- 本地存储:自动保存所有数据到本地。
- 导出简单:一键导出标准格式JSON文件。
- 다중 모델 지원:支持多种主流AI模型,可自定义模型。
- 멀티 포맷 지원:支持PDF、Word、TXT等多种文件格式。
도움말 사용
설치 프로세스
- 종속성 설치:在项目目录下运行
npm install
. - 프로젝트 시작: 실행
npm run start
프로젝트 시작하기.
사용 가이드라인
- 配置API::
- 点击“打开配置”按钮。
- 设置API地址和密钥。
- 选择或自定义AI模型。
- 设置每次生成的数据条数。
- 입력::
- 上传文件(支持PDF、DOCX、TXT)。
- 或直接输入文本内容。
- 生成数据::
- 点击“生成AI响应”按钮。
- 在多个生成结果中切换,根据需要编辑生成的内容。
- 管理数据::
- 添加到数据列表。
- 预览所有生成的数据。
- 删除不需要的数据。
- 导出为JSON文件。
기능 작동 흐름
- 一键生成训练数据::
- 选择或自定义AI模型。
- 输入或上传文本内容。
- 点击“生成AI响应”按钮,系统会自动生成训练数据。
- 批量生成::
- 在配置页面设置批量生成参数。
- 上传包含多个URL的文件或输入多个URL。
- 点击“批量生成”按钮,系统会自动生成多条训练数据。
- 灵活编辑::
- 在生成结果页面,点击需要编辑的数据条目。
- 在编辑器中修改内容,保存更改。
- 本地存储和导出::
- 所有生成的数据会自动保存到本地存储。
- 在数据管理页面,选择需要导出的数据,点击“导出为JSON”按钮。
© 저작권 정책
이 글은 저작권이 있으며 무단으로 복제해서는 안 됩니다.
관련 문서
댓글 없음...