Muyan-TTS: treinamento e síntese de fala em podcasts personalizados
综合介绍 Muyan-TTS 是一个专为播客场景设计的开源文本转语音(TTS)模型。它通过超过10万小时的播客音频数据预训练,支持零样本语音合成,生成高质量的自然语音。模型基于 Llama-3.2-3...
CAD-MCP: serviços MCP para controle de software CAD por meio de comandos de linguagem natural
综合介绍 CAD-MCP 是一个开源项目,允许用户通过自然语言指令控制 CAD 软件进行绘图操作。它结合了自然语言处理和 CAD 自动化技术,让用户无需手动操作 CAD 界面,只需输入简单的文字命令即...
Cotrans: tradutor completo de imagens de mangá (código aberto e gratuito)
综合介绍 manga-image-translator(Cotrans翻译器开源版),用于翻译漫画或图片中的文字。提供命令行交互方式和在线演示,拥有批量转换模式、web服务器模式等多样化的使用选项...
GraphGen: ajuste fino de modelos de linguagem usando gráficos de conhecimento para gerar dados sintéticos
综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架,托管于 GitHub,专注于通过知识图谱指导合成数据生成,优化大语言模型(LLM)的监督微调。它从...
ACI.DEV: Integração de mais de 600 ferramentas para inteligências de IA por meio do servidor MCP
综合介绍 ACI.dev 是一个开源基础设施平台,专为 AI 智能体提供与 600 多种工具的快速集成。它通过多租户认证和细粒度权限管理,确保智能体安全访问工具,如 Google Calendar、S...
llm.pdf: projeto experimental para executar um modelo de linguagem em grande escala em um arquivo PDF
综合介绍 llm.pdf 是一个开源项目,允许用户在 PDF 文件中直接运行大型语言模型(LLM)。这个项目由 EvanZhouDev 开发,托管在 GitHub 上,展示了一种创新的方法:通过 Em...
Abogen: uma ferramenta para converter vários formatos de texto em audiolivros
综合介绍 Abogen 是一个开源工具,专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音,同时支持同步字幕生成,适合制作有声读物...
Local Deep Research: uma ferramenta executada localmente para gerar relatórios de pesquisa aprofundados
综合介绍 Local Deep Research 是一个开源的人工智能研究助手,旨在帮助用户针对复杂问题进行深度研究并生成详细的报告。它支持本地运行,使用户可以在不依赖云服务的情况下完成研究任务。工具...
DeepWiki: gerando automaticamente a documentação do repositório do GitHub e usando o diálogo de IA
综合介绍 DeepWiki 是一个由 Cognition AI 推出的免费工具,专注于为 GitHub 仓库生成结构化、类似维基百科的文档。它通过分析代码、README 文件和配置文件,自动创建详细的...
Trackers: biblioteca de ferramentas de código aberto para rastreamento de objetos de vídeo
综合介绍 Trackers 是一个开源的 Python 工具库,专注于视频中的多对象跟踪。它集成了多种领先的跟踪算法,如 SORT 和 DeepSORT,允许用户结合不同的对象检测模型(如 YOLO...