물고기 음성: 몇 개의 샘플을 사용하여 영어와 중국어 음성을 빠르고 정확하게 복제합니다.일반 소개 피쉬 스피치는 피쉬 오디오에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 합성 도구입니다. 이 도구는 VQ-GAN, Llama 및 VITS와 같은 최첨단 AI 기술을 기반으로 하며 텍스트를 사실적인 음성으로 변환할 수 있습니다.Fish S...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 음성 복제4개월 전01.5K
IMS Toucan: 빠르고 제어 가능한 다국어(7000개 이상의 언어 지원) 텍스트 음성 변환 도구综合介绍 IMS Toucan 是由德国斯图加特大学自然语言处理研究所(IMS)开发的一个先进的文本转语音(TTS)工具包。该工具包支持超过7000种语言,具有快速、可控且计算资源需求低的特点。IMS...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 텍스트 음성 변환4개월 전0725
ChatTTS: 실제 사람이 말하는 목소리를 모방하는 음성 생성 모델(ChatTTS 원클릭 가속 패키지)综合介绍 ChatTTS 是一个专为对话场景设计的生成语音模型。它能够生成自然且富有表现力的语音,支持多种语言和多位说话者,适用于互动对话。该模型通过预测和控制细粒度的韵律特征,如笑声、停顿和插话,超...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 텍스트 음성 변환4개월 전01.5K
zChunk:基于Llama-70B的通用语义分块策略综合介绍 zChunk是由ZeroEntropy开发的一种新型分块策略,旨在为通用语义分块提供解决方案。该策略基于Llama-70B模型,通过提示生成分块,优化了文档的分块过程,确保在信息检索时保持高...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리4개월 전0663
Chonkie:轻量级RAG文本切块库综合介绍 Chonkie 是一个轻量级且高效的 RAG(Retrieval-Augmented Generation)文本切块库,旨在帮助开发者快速、简便地对文本进行分块处理。该库支持多种分块方法,包...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리4개월 전01.4K
Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话综合介绍 Qwen4Mac是一个开源项目,旨在将Qwen大语言模型(LLM)集成到Mac的菜单栏中,方便用户随时调用和使用。该项目由andreaturchet开发和维护,提供了一种简便的方式,让用户能...최신 AI 도구# AI 자바 오픈 소스 프로젝트4개월 전0682
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)综合介绍 口袋AI(PocketPal AI 中文版)是一款强大的离线AI助手,旨在让用户随时随地与AI进行对话。该项目基于小型语言模型(SLMs),无需联网即可在手机上运行,特别适配中文用户体验。口...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 현지화 채팅 애플리케이션4개월 전0979
Kokoro WebGPU: 브라우저에서 오프라인 작업을 위한 텍스트 음성 변환 서비스综合介绍 Kokoro WebGPU是Kokoro文本转语音(TTS)模型的WebGPU版本,由WebML Community在Hugging Face平台上提供。该项目利用WebGPU技术,使用户能...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 텍스트 음성 변환4개월 전0974
Unsloth: 대규모 언어 모델의 효율적인 미세 조정 및 학습을 위한 오픈 소스 도구종합 소개 Unsloth는 대규모 언어 모델(LLM)을 미세 조정하고 학습하기 위한 효율적인 도구를 제공하기 위해 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 라마, 미스트랄, 파이, 젬마 등 잘 알려진 다양한 모델을 지원합니다.Unsloth의...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정4개월 전01.1K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述综合介绍 视频分析工具(Video Analyzer)是一个综合性的视频分析工具,结合了计算机视觉、音频转录和自然语言处理技术,能够生成详细的视频内容描述。该工具通过提取视频中的关键帧,转录音频内容...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 시각적 표적 탐지4개월 전01.4K
CogVLM2: 비디오 이해와 여러 차례의 대화를 지원하는 오픈 소스 멀티모달 모델综合介绍 CogVLM2 是由清华大学数据挖掘研究组(THUDM)开发的开源多模态模型,基于 Llama3-8B 架构,旨在提供与 GPT-4V 相当甚至更优的性能。该模型支持图像理解、多轮对话以及视...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 시각적 표적 탐지4개월 전0784
개인 건강 데이터 관리를 위한 AI 비서, 맞춤형 건강 플랜을 위한 검사 보고서 업로드: OpenHealthForAll综合介绍 OpenHealthForAll 是一个开源项目,旨在帮助用户管理和理解个人健康数据。通过利用人工智能技术,OpenHealthForAll 提供了一个本地运行的健康助手,帮助用户更好地管理...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 생활 효율 도우미4개월 전0830
OpenPilot:开源自动驾驶系统,为爱车DIY一套自己的智能驾驶系统综合介绍 OpenPilot 是由 comma.ai 开发的开源自动驾驶系统,旨在通过先进的驾驶辅助功能提升现有车辆的驾驶体验和安全性。自 2016 年首次发布以来,OpenPilot 已支持超过 2...최신 AI 도구# AI 자바 오픈 소스 프로젝트4개월 전0928
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天综合介绍 OpenAOE 是一个开源的大模型群聊框架,旨在解决当前市场上缺乏多模型并行响应的聊天框架的问题。通过 OpenAOE,用户可以同时与多个大语言模型(LLM)进行对话,获取并行输出。该框架支...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 통합 다중 모델 대화 플랫폼4개월 전0695
에이전틱 보안: 포괄적인 퍼즈 테스트 및 공격 기법을 제공하는 오픈 소스 LLM 취약점 스캔 도구综合介绍 Agentic Security是一个开源的LLM(大语言模型)漏洞扫描工具,旨在为开发者和安全专家提供全面的模糊测试和攻击技术。该工具支持自定义规则集或基于代理的攻击,能够集成LLM AP...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 프롬프트 탈옥4개월 전0710
RAG 기반 건강 조언을 제공하는 미니 도우미 구축(시범 프로젝트)综合介绍 LLM-RAG-Longevity-Coach 是一个基于大语言模型(LLM)和检索增强生成(RAG)技术的聊天机器人,旨在为用户提供个性化的健康和长寿建议。该项目由 Tyler Burle...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 생활 효율 도우미4개월 전0829
Maestro:简化主流开源视觉语言模型微调过程的工具综合介绍 Maestro 是由 Roboflow 开发的一款工具,旨在简化和加速多模态模型的微调过程,让人人都可以训练自己的视觉大模型。它提供了现成的配方,用于微调流行的视觉语言模型(VLM),如 F...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정4개월 전0881
One-Prompt-One-Story:文本提示生成角色身份一致的图像综合介绍 One-Prompt-One-Story (1Prompt1Story) 是一个创新的文本到图像生成工具,旨在通过单一提示实现一致性图像生成。该项目由刘涛等人在ICLR 2025会议上提出...최신 AI 도구# AI 이미지 스타일 제어# AI 자바 오픈 소스 프로젝트4개월 전0874
Next.js 애플리케이션에 RAG 기반 온라인 채팅 도구 추가하기综合介绍 Upstash RAG Chat Component是一个专为Next.js应用程序设计的React组件,旨在提供基于RAG(检索增强生成)技术的AI聊天界面。该组件结合了Upstash V...최신 AI 도구# AI 자바 오픈 소스 프로젝트4개월 전0789