GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: 지식 그래프를 사용하여 합성 데이터를 생성하기 위한 언어 모델 미세 조정

개요 GraphGen은 상하이의 AI 연구소인 OpenScienceLab에서 개발한 오픈 소스 프레임워크로, 지식 그래프를 통해 합성 데이터 생성을 안내하여 대규모 언어 모델(LLM)의 감독 미세 조정을 최적화하는 데 중점을 두고 있으며, GitHub에 호스팅되어 있습니다. 개발 배경은 ...
2개월 전
0471
WeClone:用微信聊天记录和语音训练数字分身

WeClone: WeChat 채팅 로그와 음성으로 디지털 도플갱어 훈련하기

종합 소개 WeClone은 대규모 언어 모델 및 음성 합성 기술과 결합된 WeChat 채팅 로그와 음성 메시지를 사용하여 사용자가 개인화된 디지털 도플갱어를 만들 수 있는 오픈 소스 프로젝트입니다. 이 프로젝트는 사용자의 채팅 습관을 분석하여 모델을 훈련시킬 뿐만 아니라 소수의 음성 샘플로 사실적인 소리를 생성할 수 있습니다....
3 개월 전
0599