SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中综合介绍 SHMT(Self-supervised Hierarchical Makeup Transfer)是一个基于潜在扩散模型的自我监督分层化妆迁移项目,旨在通过无监督学习方法实现化妆效果的高质...最新AI工具# AI开源项目# AI换脸与换装5个月前01.1K
VITA:开源视觉与语音实时交互的多模态大语言模型综合介绍 VITA是一个领先的开源交互式多模态大语言模型项目,率先实现了真正的全方位多模态交互能力。该项目于2024年8月推出VITA-1.0版本,开创了首个开源交互式全模态大语言模型的先河。2024...最新AI工具# AI开源项目# 多模态实时互动产品5个月前01.3K
CrisperWhisper:精确的逐字语音转录工具综合介绍 CrisperWhisper 是一个基于 OpenAI Whisper 的高级语音识别工具,专注于快速、精确和逐字的语音转录。它能够提供精确的单词级时间戳,甚至在语音填充和停顿的情况下也能准...最新AI工具# AI开源项目# AI语音转文本5个月前01.6K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译综合介绍 AI no jimaku gumi(AI の字幕組)是一个强大的命令行视频字幕处理工具,专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术,包括 Whisper 语音...最新AI工具# AI开源项目# AI翻译# AI语音转文本5个月前01.1K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具综合介绍 TransRouter 是一个基于 Google Gemini 大模型的实时语音翻译工具,专门设计用于实现中英文之间的实时语音互译。该工具能够无缝集成到 Zoom 等视频会议软件中,为跨语言...最新AI工具# AI开源项目# 多模态实时互动产品5个月前01K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现综合介绍 开源NotebookLM是一个创新的人工智能项目,它结合了Deepseek-V3的语言理解能力和PlayHT的语音合成技术,旨在创建一个智能化的笔记对话系统。该项目由Build Fast w...最新AI工具# AI开源项目# AI文本与音频/视频总结工具5个月前01.4K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务综合介绍 Diffbot LLM推理服务器是一个创新的大规模语言模型系统,它基于LLama模型架构进行了特殊优化和改进。该项目最大的特点是将实时知识图谱(Knowledge Graph)与检索增强生成...最新AI工具# AI开源项目# 知识图谱# 知识检索与RAG框架5个月前01.3K
JupyterLab Magic Wand:在JupyterLab中使用AI助手提升工作效率综合介绍 JupyterLab Magic Wand是一个实验性的JupyterLab扩展,旨在为JupyterLab笔记本提供内嵌的AI助手功能。该扩展由Zsailer开发,主要用于提升数据科学家和...最新AI工具# AI开源项目5个月前0992
LuminaBrush:使用智能绘画工具为图像添加照明打光效果综合介绍 LuminaBrush 是一个创新的交互式图像照明效果编辑工具,由人工智能技术驱动。该项目采用两阶段框架处理图像:第一阶段将输入图像转换为"均匀照明"的外观,第二阶段则根据用户的涂鸦操作生成...最新AI工具# AI图像风格控制# AI开源项目5个月前01.8K
Groq AppGen:使用Groq API展示Llama 3.3 70B HTML代码生成能力的实验项目综合介绍 Groq AppGen 是一个创新的交互式网页应用生成器,由 Groq 公司开发并开源。该项目展示了 Llama 3.3 70B 模型在 HTML 代码生成方面的强大能力。通过集成 Groq...最新AI工具# AI开源项目5个月前01.1K
llms.txt Generator:快速抓取网站内容并,生成LLM训练文本数据集综合介绍 llmstxt-generator 是一个专业的网站内容提取和整合工具,专门为大语言模型(LLM)的训练和推理准备高质量文本数据集。该工具由 Mendable AI 开发,采用 @firec...最新AI工具# AI开源项目# 文档提取与清洗5个月前01.3K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型综合介绍 Raycast-G4F(GPT4Free) 是一款强大的 Raycast 扩展工具,让用户可以免费访问包括 GPT-4、Llama-3 在内的多种高级 AI 模型。该扩展不仅提供了实时对话流...最新AI工具# AI开源项目# AI本地化聊天应用# 免费大模型API5个月前01.2K
Gemini Search:Gemini 2.0 Flash构建的 Perplexity 风格 AI 搜索引擎综合介绍 Gemini-Search 是一个基于 Google Gemini 2.0 技术打造的开源智能搜索引擎项目。该项目采用 TypeScript 开发,致力于复制 Perplexity 搜索引擎...最新AI工具# AI开源项目# AI搜索工具5个月前01.2K
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手综合介绍 Devin.cursorrules 是一个创新的开源项目,旨在将价格实惠的Cursor或Windsurf IDE(约20美元)转换为类似 Devin 这样强大的AI编程助手。该项目提供了一套...最新AI工具# AI开源项目# AI编程5个月前01.4K
One Hub:管理和分发OpenAI接口,支持多种模型和统计功能综合介绍 One Hub 是一个基于 One API 二次开发的 OpenAI 接口管理和分发系统。该项目由 MartialBE 开发,旨在提供更广泛的模型支持和更完善的统计功能。One Hub 具有...最新AI工具# AI开源项目6个月前0974
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目综合介绍 Fish Speech 衍生项目 Fish Agent 是一款革命性的端到端AI语音克隆系统,基于V0.1 3B模型架构开发。作为一个完全端到端的语音克隆处理系统,其最大特点是采用创新的无语...最新AI工具# AI开源项目# AI语音克隆# 多模态实时互动产品6个月前01.1K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画综合介绍 Story-Adapter 是一个创新的故事可视化框架,它能够将文本故事转换为连贯的图像序列。这个项目由研究人员开发,采用了无需训练的迭代方法来生成高质量的故事插图。该框架的特点是能够处理长...最新AI工具# AI图像风格控制# AI开源项目6个月前01.3K
小红书AI运营助手:自动生成和发布小红书文章综合介绍 小红书AI运营助手(xhsaipublisher)是一个专为在小红书平台上发布文章而设计的自动化工具。该项目结合了图形用户界面与自动化脚本,利用大模型技术生成内容,并通过浏览器自动登录和发布...最新AI工具# AI副业赚钱项目# AI开源项目6个月前01.3K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪综合介绍 FunClip是一款完全开源的本地化自动视频剪辑工具,由阿里巴巴达摩院TONGYI语音实验室开发。该工具集成了工业级的 Paraformer-Large 语音识别模型,可以准确识别视频中的语...最新AI工具# AI开源项目# AI语音转文本# AI音视频编辑6个月前01.1K