AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具

AnimeGamer: 언어 명령으로 애니메이션 동영상 및 캐릭터 상호작용을 생성하는 오픈 소스 도구

AnimeGamer는 텐센트 ARC Lab의 오픈 소스 툴입니다. 사용자는 "소우스케가 보라색 차를 타고 돌아다녀"와 같은 간단한 언어 명령으로 애니메이션 동영상을 생성할 수 있으며, 마법의 소녀의 모험과 스카이 시티의 키키와 같은 다양한 애니메이션 캐릭터가 서로 상호작용할 수 있습니다.
2개월 전
03800
Agent S:像人类一样操作电脑的开源智能体框架

에이전트 S: 인간처럼 컴퓨터를 작동하는 지능형 기관을 위한 오픈 소스 프레임워크

일반 소개 에이전트 S는 Simular AI에서 개발한 오픈 소스 프레임워크로, 그래픽 사용자 인터페이스(GUI)를 통해 인간처럼 컴퓨터를 조작할 수 있는 인공지능입니다. 멀티모달 대규모 언어 모델과 경험적 학습 기법을 사용하여 웹 검색, 문서 편집, 소프트웨어 사용 등의 작업을 수행합니다.
2개월 전
04390
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice: 실리콘 기반 플로우 API를 기반으로 하는 텍스트 음성 변환 그래픽 인터페이스

일반 소개 Text2Voice는 실리콘 기반 모빌리티 API를 기반으로 텍스트 음성 변환 기능을 제공하는 오픈 소스 도구로, 깔끔한 그래픽 사용자 인터페이스(GUI)가 가장 큰 특징입니다. 개발자 쉘든 리가 깃허브에서 만든 이 도구는 다음과 같은 기능을 제공합니다.
2개월 전
03630
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl: 인물 사진을 지브리 스타일의 이미지로 변환하는 무료 도구

일반 소개 EasyControl은 오픈 소스 프로젝트로, 효율적이고 유연한 이미지 생성 제어를 제공하기 위해 확산 변압기(DiT) 아키텍처를 기반으로 합니다. 그중에서도 지브리 컨트롤 LoRA는 100개의 서브만 사용하여 특별한 기능 중 하나입니다.
2개월 전
04660
YOLOE:实时视频检测和分割物体的开源工具

YOLOE: 실시간 비디오 감지 및 객체 세분화를 위한 오픈 소스 도구

YOLOE는 칭화대학교 소프트웨어학부의 멀티미디어 인텔리전스 그룹(THU-MIG)에서 개발한 오픈 소스 프로젝트로, 정식 명칭은 "You Only Look Once Eye"입니다. YOLO 시리즈 확장에 속하는 PyTorch 프레임워크를 기반으로 합니다.
2개월 전
04890
集成多种先进语音合成服务的开源运营项目

여러 고급 음성 합성 서비스를 통합하는 오픈 소스 운영 프로젝트

일반 소개 오픈 보이스 캔버스는 ItusiAI 팀에서 개발한 오픈 소스 음성 합성 플랫폼입니다. 50개 이상의 언어를 지원하며, 텍스트를 자연스러운 음성으로 변환하고 오디오를 업로드하여 개인화된 음성을 복제할 수 있습니다. 이 프로젝트는 Ope...
2개월 전
04770
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind: 타임스탬프별 동영상 포지셔닝 콘텐츠 및 Q&A 오픈 소스 프로젝트

일반 소개 비디오마인드는 긴 동영상을 위한 추론, Q&A 및 요약 생성에 중점을 둔 오픈 소스 멀티모달 AI 도구입니다. 홍콩 폴리테크닉 대학교의 예 리우와 싱가포르 국립대학교의 쇼 랩 팀이 개발했습니다. 이 도구는 비디오에 대한 인간의 이해를 모방합니다...
2개월 전
04900
SuperCoder:命令行终端运行的智能代码助手

슈퍼코더: 명령줄 터미널 실행을 위한 지능형 코드 도우미

일반 소개 슈퍼코더는 터미널에서 실행되는 지능형 도구로 프로그래머를 위해 설계되었습니다. AI 기술을 사용하여 사용자가 코드를 검색하고, 프로젝트 구조를 보고, 파일을 편집하고, 버그를 수정할 수 있도록 도와주며, 이 프로젝트는 GitHub의 huytd에서 오픈 소스이며 다음을 지원합니다.
2개월 전
04830