Sharenet.ai

日拱一卒,分享为王!
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS:个性化播客语音训练与合成

综合介绍 Muyan-TTS 是一个专为播客场景设计的开源文本转语音(TTS)模型。它通过超过10万小时的播客音频数据预训练,支持零样本语音合成,生成高质量的自然语音。模型基于 Llama-3.2-3...
4周前
02220
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

综合介绍 CAD-MCP 是一个开源项目,允许用户通过自然语言指令控制 CAD 软件进行绘图操作。它结合了自然语言处理和 CAD 自动化技术,让用户无需手动操作 CAD 界面,只需输入简单的文字命令即...
4周前
02420
Cotrans:一站式漫画图片翻译器(开源免费)

Cotrans:一站式漫画图片翻译器(开源免费)

综合介绍 manga-image-translator(Cotrans翻译器开源版),用于翻译漫画或图片中的文字。提供命令行交互方式和在线演示,拥有批量转换模式、web服务器模式等多样化的使用选项...
4周前
01.6K0
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen:利用知识图谱生成合成数据微调语言模型

综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架,托管于 GitHub,专注于通过知识图谱指导合成数据生成,优化大语言模型(LLM)的监督微调。它从...
4周前
01890
ACI.DEV:通过MCP服务器为AI智能体集成600+工具

ACI.DEV:通过MCP服务器为AI智能体集成600+工具

综合介绍 ACI.dev 是一个开源基础设施平台,专为 AI 智能体提供与 600 多种工具的快速集成。它通过多租户认证和细粒度权限管理,确保智能体安全访问工具,如 Google Calendar、S...
4周前
02680
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf:在PDF文件中运行大型语言模型的实验项目

综合介绍 llm.pdf 是一个开源项目,允许用户在 PDF 文件中直接运行大型语言模型(LLM)。这个项目由 EvanZhouDev 开发,托管在 GitHub 上,展示了一种创新的方法:通过 Em...
4周前
02180
Abogen:将多种文本格式转换为有声读物的工具

Abogen:将多种文本格式转换为有声读物的工具

综合介绍 Abogen 是一个开源工具,专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音,同时支持同步字幕生成,适合制作有声读物...
4周前
02060
Local Deep Research:本地运行的生成深度研究报告工具

Local Deep Research:本地运行的生成深度研究报告工具

综合介绍 Local Deep Research 是一个开源的人工智能研究助手,旨在帮助用户针对复杂问题进行深度研究并生成详细的报告。它支持本地运行,使用户可以在不依赖云服务的情况下完成研究任务。工具...
4周前
02250
DeepWiki:自动生成GitHub仓库文档并用AI对话

DeepWiki:自动生成GitHub仓库文档并用AI对话

综合介绍 DeepWiki 是一个由 Cognition AI 推出的免费工具,专注于为 GitHub 仓库生成结构化、类似维基百科的文档。它通过分析代码、README 文件和配置文件,自动创建详细的...
4周前
02290
Trackers:用于视频对象跟踪的开源工具库

Trackers:用于视频对象跟踪的开源工具库

综合介绍 Trackers 是一个开源的 Python 工具库,专注于视频中的多对象跟踪。它集成了多种领先的跟踪算法,如 SORT 和 DeepSORT,允许用户结合不同的对象检测模型(如 YOLO...
4周前
02120