Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: um modelo de conversão de texto em fala de código aberto para geração e clonagem de fala de alta qualidade

综合介绍 Llasa-3B是由香港科技大学音频实验室(HKUST Audio)开发的一个开源文本转语音(TTS)模型。该模型基于Llama 3.2B架构,经过细致调优,提供高质量的语音生成,不仅支持多...
6 meses atrás
01.4K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务

Goose: inteligências de programação escalonáveis de código aberto que automatizam tarefas de programação de processo completo

综合介绍 Goose是由 Block 公司开发的一个开源AI代理工具,旨在帮助开发者自动化处理日常开发任务。它支持多种大型语言模型(LLM),通过命令行或桌面应用接口与用户互动。Goose可以执行从代...
6 meses atrás
01.4K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

ChatSum do servidor MCP: Confiando no MCP para consultar e resumir mensagens do WeChat no Claude

Introdução geral O MCP Server ChatSum é um projeto de código aberto criado para ajudar os usuários a consultar e resumir mensagens de bate-papo. O projeto está hospedado no GitHub e fornece um conjunto de ferramentas avançado que permite aos usuários consultar registros de bate-papo com base em parâmetros específicos e gerar resumos correspondentes...
5 meses atrás
01.4K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: extrai quaisquer dados não estruturados de documentos/multimídia e os analisa em dados estruturados

综合介绍 OmniParse是一个强大的数据解析与优化平台,旨在将任何非结构化数据转换为结构化、可操作的数据,优化后适用于GenAI(生成式人工智能)框架。无论是处理文档、表格、图像、视频、音频文件还...
9 meses atrás
01.4K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: uma interface de bate-papo limpa para interagir com modelos nativos do Ollama

Introdução geral O HiOllama é uma interface amigável criada em Python e Gradio, projetada para interagir com os modelos do Ollama. Ela oferece uma interface da Web simples e intuitiva que suporta geração de texto em tempo real e recursos de gerenciamento de modelos. Os usuários podem ajustar parâmetros como temperatura e a maioria...
9 meses atrás
01.4K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色

MangaNinjia: uma ferramenta automatizada de coloração de linhas para colorir rapidamente desenhos de anime em preto e branco.

综合介绍 MangaNinjia 是阿里巴巴通义视觉智能实验室(Ali-Vilab)开发的一个开源项目,专注于线稿上色的自动化处理。这一工具通过深度学习技术,实现了对参考图像的精确色彩匹配,极大地提高...
6 meses atrás
01.4K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream: um modelo de linguagem visual leve e de código aberto para retropropagação em lote de palavras-chave de imagens

综合介绍 Moondream 是一个开源的轻量级视觉语言模型,旨在通过深度学习和计算机视觉技术实现图像描述功能。该模型能够在各种平台上高效运行,特别适用于边缘设备。Moondream 采用先进的技术和...
7 meses atrás
01.4K