PhiData:构建拥有记忆、知识和工具的AI智能体综合介绍 PhiData是一个专为开发智能AI助手而设计的框架。它通过增强记忆、知识整合和工具调用能力,使AI助手能够进行长期对话、提供精准的业务上下文,并执行各种操作。PhiData不仅提升了AI助...最新AI工具# AI开源项目# 智能体应用3个月前01.3K0
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri综合介绍 Ichigo是一个开源的实时语音AI项目,旨在扩展基于文本的语言模型,使其具备原生的“听力”能力。该项目采用了早期融合技术,灵感来自Meta的Chameleon论文。Ichigo的目标是成为...最新AI工具# AI开源项目# 多模态实时互动产品5个月前01.3K0
99AI:集成多模态AI服务的商业化Web应用(免费开源)综合介绍 99AI 是一个开源的 AI Web 应用项目,旨在提供一个易部署、低门槛的集成化人工智能服务平台。该项目支持智能对话、多模态模型、应用广场、联网搜索等功能,并集成了 AI 绘画、音乐和视频...最新AI工具# AI副业赚钱项目# AI开源项目# AI本地化聊天应用7个月前01.3K0
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布综合介绍 MoneyPrinter V2 是由FujiwaraChoki开发的一个开源项目,旨在通过自动化手段帮助用户在线赚钱。该项目主要集成了Twitter自动化、YouTube短视频生成以及联盟营...最新AI工具# AI副业赚钱项目# AI开源项目# AI营销5个月前01.3K0
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用综合介绍 UI-TARS Desktop 是由字节跳动开发的一款基于 UI-TARS(视觉语言模型)的图形界面代理应用。该应用允许用户通过自然语言来控制计算机,实现更直观和高效的人机交互。UI-TAR...最新AI工具# AI开源项目# 桌面自动化智能体5个月前01.3K0
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手综合介绍 Devin.cursorrules 是一个创新的开源项目,旨在将价格实惠的Cursor或Windsurf IDE(约20美元)转换为类似 Devin 这样强大的AI编程助手。该项目提供了一套...最新AI工具# AI开源项目# AI编程5个月前01.3K0
Voice Changer:实时语音变换工具,让喜欢的动漫角色唱歌综合介绍 Voice Changer 是一个开源的实时语音变换工具,支持多种 AI 语音模型,如 MMVC、so-vits-svc、RVC、DDSP-SVC 和 Beatrice。该工具兼容多个平台...最新AI工具# AI开源项目# AI语音克隆8个月前01.3K0
Fullmoon:本地大语言模型聊天的iOS应用综合介绍 Fullmoon是一款专为iOS设备设计的应用程序,旨在提供与本地大语言模型进行私密聊天的功能。该应用优化了Apple Silicon,支持在iPhone、iPad和Mac上运行。用户的聊天...最新AI工具# AI开源项目# AI本地化聊天应用4个月前01.3K0
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面综合介绍 SP-MangaEditer 是一个独立的漫画编辑平台,专为漫画创作者设计。该平台支持图像生成、图层编辑、图像调整、滤镜应用等多种功能,帮助用户轻松创建高质量的漫画插图。用户可以通过简单的操...最新AI工具# AI图像生成辅助工具# AI开源项目5个月前01.3K0
文多多 AiPPT:AI生成PPT,演讲稿生成综合介绍 AiPPT 是一个基于人工智能技术的PPT生成工具,旨在帮助用户快速创建专业演示文稿。它通过输入主题、上传文件或提供网址等方式,自动生成内容丰富、设计精美的幻灯片,支持原生图表、动画和3D特...最新AI工具# AI开源项目# AI生成演示文稿/PPT3个月前01.3K0
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包综合介绍 Clone Voice 是一个开源的声音克隆工具,提供了一个基于Web的界面,允许用户利用任何声音或个人声音录制来克隆声音。该工具操作简单,即使没有NVIDIA GPU,也可以通过预编译的应...最新AI工具# AI开源项目# AI语音克隆8个月前01.3K0
InstantID:上传一张图片,迁移人像特征来生成不同风格图片综合介绍 InstantID是一项先进的技术,专注于利用单张参考身份证图片,在几秒钟内生成具有个性化风格或姿态的图像,同时确保高度保真。该技术采用了基于扩散模型的解决方案,通过集成面部图片、地标图...最新AI工具# AI图像风格控制# AI开源项目# AI换脸与换装9个月前01.3K0
DeepSeek Engineer:基于DeepSeek API的实验性编码助手,附提示词综合介绍 DeepSeek Engineer是一款基于DeepSeek API开发的强大编程助手工具,它能够通过直观的命令行界面与用户进行交互,协助完成各种软件开发任务。该工具将大型语言模型的能力与实...最新AI工具# AI开源项目4个月前01.3K0
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)综合介绍 EchoMimic 是一个开源项目,旨在通过音频驱动生成逼真的肖像动画。该项目由蚂蚁集团的终端技术部门开发,利用可编辑的标志点条件,结合音频和面部标志点生成动态的肖像视频。EchoMimic...最新AI工具# AI开源项目# AI数字人5个月前01.3K0
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具综合介绍 文本提取API(text-extract-api)是一个强大的工具,旨在从各种文档格式(如PDF、Word、PPTX等)中提取和解析内容。该API利用最先进的光学字符识别(OCR)技术和Ol...最新AI工具# AI开源项目# OCR# 文档提取与清洗5个月前01.3K0
DeepFace:实现面部年龄、性别、情绪、种族识别的轻量级Python库综合介绍 DeepFace是一个轻量级的面部识别和面部属性分析(包括年龄、性别、情绪和种族)的Python库。它集成了多种先进的面部识别模型,如VGG-Face、FaceNet、OpenFace、De...最新AI工具# AI开源项目5个月前01.3K0
LTX Video(LTXV):生成高质量视频的实时视频生成开源模型综合介绍 LTX-Video是由Lightricks开发的首个基于DiT(Diffusion Transformer)的实时视频生成模型。该模型能够在768x512分辨率下以24帧每秒的速度生成高质量...最新AI工具# AI图像转视频# AI开源项目# AI文本转视频5个月前01.3K0
Chonkie:轻量级RAG文本切块库综合介绍 Chonkie 是一个轻量级且高效的 RAG(Retrieval-Augmented Generation)文本切块库,旨在帮助开发者快速、简便地对文本进行分块处理。该库支持多种分块方法,包...最新AI工具# AI开源项目# 文档提取与清洗4个月前01.3K0
LivePortrait:静态图像、视频生成动态肖像动画工具综合介绍 LivePortrait 是一款由快手科技开发的先进 AI 动态肖像动画工具。它利用创新的 AI 技术,将静态图像转化为生动的视频动画。无论是使用真实照片、动画风格还是艺术肖像,LivePo...最新AI工具# AI图像转视频# AI开源项目# AI视频转换风格6个月前01.3K0