Gemini Teacher:英语口语发音纠正助手综合介绍 Gemini Teacher 是一个基于 Google Gemini AI 的英语口语练习助手。它能够实时识别用户的英语发音,并提供即时反馈和纠正建议。该工具旨在帮助用户提高英语口语能力,通...最新AI工具# AI开源项目# AI教育工具4个月前09700
bilive:B站无人监守直播录制与自动切片、上传工具综合介绍 bilive是一个专为B站直播录制设计的工具,提供极快的直播录制、自动切片、弹幕渲染和字幕生成功能。该工具兼容超低配置机器,支持7x24小时无人值守录制,自动识别并渲染弹幕和字幕,自动切片并...最新AI工具# AI开源项目# AI音视频编辑4个月前09370
R1-V:低成本强化学习实现视觉语言模型泛化能力综合介绍 R1-V 是一个开源项目,旨在通过低成本的强化学习(RL)实现视觉语言模型(VLM)的突破。该项目利用可验证的奖励机制,激励 VLMs 学习通用的计数能力。令人惊叹的是,R1-V 的 2B ...最新AI工具# AI开源项目4个月前01.1K0
PPTX2MD:将PPTX文件转换为Markdown的专用工具综合介绍 PPTX2MD是一个开源工具,旨在将PowerPoint的PPTX文件转换为Markdown格式。该工具由GitHub用户ssine开发,支持保留标题、列表、文本格式(如粗体、斜体、颜色和超...最新AI工具# AI开源项目# 文档提取与清洗4个月前09540
DSPy Examples:展示DSPy功能的实用示例综合介绍 DSPy示例代码库是一个由Langtrace AI团队维护的GitHub代码库,展示了使用DSPy构建的各种AI程序示例。该代码库旨在通过实际示例展示DSPy的多种功能,帮助开发者更好地理解...最新AI工具# AI开源项目4个月前09450
Go-Proxy:Docker集成的高性能反向代理服务器综合介绍 Go-Proxy是一个使用Go语言开发的高性能代理服务器,主要用于在不同网络环境中提供代理服务。它支持多种协议,包括HTTP、HTTPS、SOCKS5、WebSocket、TCP和UDP,能...最新AI工具# AI开源项目4个月前08200
CoT-Lab:探索人机协作迭代思考的实验性对话工具综合介绍 CoT-Lab(人机协同思维实验室)是一个探索人机协作新范式的实验性界面。基于认知负荷理论和主动学习原则,CoT-Lab 通过创建“思维伙伴”关系,促进人类与人工智能的深度认知对齐。该项目旨...最新AI工具# AI开源项目4个月前08060
让 DeepSeek 官网聊天界面支持内嵌渲染图表的浏览器扩展综合介绍 DeepSeek Diagrams Extension是一款专为DeepSeek网站设计的Chrome浏览器扩展,旨在帮助用户在DeepSeek网站中内嵌渲染图表。该扩展基于Mermaid...最新AI工具# AI开源项目4个月前08900
Orate:集成知名语音生成、语音转录与变声模型的统一API综合介绍 Orate 是一个专注于语音生成与转录的人工智能工具包。它提供了一个统一的API,能够与领先的AI提供商(如OpenAI、ElevenLabs和AssemblyAI)无缝集成,帮助用户创建逼...最新AI工具# AI开源项目# AI文本转语音# AI语音转文本4个月前09840
Reflex LLM Examples:展示大语言模型实际应用的AI应用集合综合介绍 Reflex LLM Examples是一个由Reflex开发团队创建的开源项目,旨在展示大语言模型(LLM)的实际应用。该项目汇集了多个基于Reflex构建的AI应用,展示了来自Googl...最新AI工具# AI开源项目4个月前08460
DeepClaude:融合DeepSeek R1链式推理与Claude创造力的聊天界面综合介绍 DeepClaude 是一个高性能的大语言模型(LLM)推理API和聊天界面,集成了DeepSeek R1的链式推理(CoT)能力和 Anthropic Claude 模型的创造力与代码生成...最新AI工具# AI开源项目# AI本地化聊天应用4个月前01.4K0
BEN2:从图像、视频中快速移除背景的深度学习模型综合介绍 BEN2(Background Erase Network 2)是由Prama LLC开发的一款深度学习模型,专门用于自动从图像中移除背景,并生成前景图像。该模型采用了创新的Confiden...最新AI工具# AI开源项目# AI抠图改背景1天前09990
AI Web Operator:浏览器自动化操作,OpenAI Operator的开源实现综合介绍 AI Web Operator 是一个开源的 AI 浏览器操作工具,旨在通过集成多种 AI 技术和 SDK,简化用户在浏览器中的操作体验。该工具基于 Browserbase 和 Vercel...最新AI工具# AI开源项目# 多模态实时互动产品4个月前09830
Exa & Deepseek Chat App:实时Web搜索与智能推理的开源聊天应用综合介绍 Exa & Deepseek Chat App 是一个开源的智能聊天应用,主要功能包括使用 Exa 的 API 进行实时 Web 搜索和利用 Deepseek R1 语言模型进行智能...最新AI工具# AI开源项目# AI搜索工具4个月前01.1K0
LLM API Engine:通过自然语言快速生成和部署API综合介绍 LLM API Engine 是一个开源项目,旨在帮助开发者快速构建和部署AI驱动的API。该项目利用大语言模型(LLM)和智能网页抓取技术,允许用户通过自然语言描述来创建自定义API。其主...最新AI工具# AI开源项目4个月前09370
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具综合介绍 PengChengStarling(鹏城实验室)是一个多语言自动语音识别(ASR)工具,能够将不同语言的语音转换为对应的文本。这个工具包基于icefall项目开发,提供了完整的语音识别流程...最新AI工具# AI开源项目# AI语音转文本4个月前08630
Doc2XAPITranslate:文档全文翻译:快速将英文PDF/MD论文翻译为中文文档综合介绍 Doc2XAPITranslate 是一个强大的文档全文翻译工具,专为将英文PDF或Markdown论文快速翻译为中文文档而设计。该工具支持多种翻译器,包括DeepSeek、OpenAI、O...最新AI工具# AI开源项目# AI翻译4个月前08880
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型综合介绍 SpeechGPT 2.0-preview 是 OpenMOSS 推出的首个拟人化实时交互系统,基于百万小时级语音数据训练而成。该系统具备拟人口语化表达与百毫秒级低延迟响应,支持自然流畅的实...最新AI工具# AI开源项目# 多模态实时互动产品5个月前08870
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务综合介绍 Goose是由 Block 公司开发的一个开源AI代理工具,旨在帮助开发者自动化处理日常开发任务。它支持多种大型语言模型(LLM),通过命令行或桌面应用接口与用户互动。Goose可以执行从代...最新AI工具# AI开源项目# AI编程# 智能体开发框架5个月前01.2K0