Omni-RGPT: 시각 콘텐츠 분석을 개선하기 위한 이미지 및 비디오 영역 수준 이해를 위한 멀티모달 그랜드 모델综合介绍 Omni-RGPT 是一个多模态大语言模型,旨在实现图像和视频的区域级理解。通过引入 Token Mark 技术,Omni-RGPT 能够在视觉特征空间内高亮目标区域,并通过区域提示(如框或...최신 AI 도구# AI 자바 오픈 소스 프로젝트5개월 전0888
Megrez-3B-Omni: 텍스트, 이미지 및 오디오 멀티모달 이해 및 분석을 지원하는 엔드사이드 멀티모달 이해 모델综合介绍 Infini-Megrez是由无问芯穹(Infinigence AI)开发的边缘智能解决方案,旨在通过软硬件协同设计,实现高效的多模态理解和分析。该项目的核心是Megrez-3B模型,支持图...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 멀티모달 실시간 인터랙티브 제품5개월 전01K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流综合介绍 百聆(Bailing)是一个开源的语音对话助手,旨在通过语音与用户进行自然的对话。该项目结合了语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)技术,实现了...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 멀티모달 실시간 인터랙티브 제품5개월 전01.1K
WikiChat:使用维基百科数据检索知识的聊天工具综合介绍 WikiChat是由斯坦福大学开发的一款实验性聊天机器人,旨在通过从维基百科检索数据来提高大语言模型的事实性。大语言模型(如ChatGPT和GPT-4)在处理最新信息或不太流行的话题时,往往...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 지식 검색 및 RAG 프레임워크5개월 전0999
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式综合介绍 OpenAI Edge TTS 是一个开源项目,提供与 OpenAI 兼容的本地文本转语音(TTS)API。该项目使用 Microsoft Edge 的在线文本转语音服务,允许用户生成高质量...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 텍스트 음성 변환5개월 전01.4K
AIEvo:创建多智能体协作应用的高效框架综合介绍 AIEvo是蚂蚁集团开源的多代理框架,旨在高效创建多代理应用。该框架严格遵循SOP任务图,提升复杂任务的执行成功率,并通过反馈和监控机制确保高灵活性和可扩展性。AIEvo已在蚂蚁集团内部生产...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 지능형 신체 개발 프레임워크5개월 전0977
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色综合介绍 MangaNinjia 是阿里巴巴通义视觉智能实验室(Ali-Vilab)开发的一个开源项目,专注于线稿上色的自动化处理。这一工具通过深度学习技术,实现了对参考图像的精确色彩匹配,极大地提高...최신 AI 도구# AI 이미지 스타일 제어# AI 자바 오픈 소스 프로젝트5개월 전01.2K
PPTAgent: PPT 프레젠테이션, 문서를 PPT로 자동 생성 및 평가综合介绍 PPTAgent是一个创新的系统,旨在从文档中自动生成演示文稿。该系统借鉴了人类创建演示文稿的方法,采用两步流程确保内容质量和视觉效果。此外,PPTAgent还引入了PPTEval,一个全面...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 생성 프레젠테이션/PPT5개월 전0977
FlowiseAI: 커스텀 LLM 애플리케이션을 위한 노드 드래그 앤 드롭 인터페이스 구축综合介绍 FlowiseAI 是一个开源的低代码工具,旨在帮助开发者构建自定义的LLM(大语言模型)应用和AI代理。通过简单的拖放界面,用户可以快速创建和迭代LLM应用,从测试到生产的过程变得更加高效...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 로우코드 워크플로5개월 전01.3K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别综合介绍 RealtimeSTT 是一个高效、低延迟的实时语音转文字库,具备先进的语音活动检测和唤醒词激活功能。该项目由 Kolja Beigel 开发,旨在为需要快速、准确语音转文字的应用提供支持...AI 뉴스# AI 자바 오픈 소스 프로젝트# AI 음성-텍스트 변환5개월 전01.3K
ALog:便携AI语音日记应用,支持语音转文字。综合介绍 ALog 是一个基于人工智能的语音日记应用,旨在帮助用户通过语音记录日常生活。该项目由 duxins 开发,并在 GitHub 上开源。用户可以通过语音输入记录日记,应用会自动将语音转换为文...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 음성-텍스트 변환5개월 전01.5K
SemHash:快速实现语义文本去重,提升数据清理效率综合介绍 SemHash 是一个轻量级且灵活的工具,用于通过语义相似性来去重数据集。它结合了 Model2Vec 的快速嵌入生成和 Vicinity 的高效 ANN(近似最近邻)相似性搜索。SemHa...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리5개월 전01K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略综合介绍 Cognita 是由 TrueFoundry 开发的一个开源框架,旨在简化基于 RAG(Retrieval-Augmented Generation)的应用开发。该框架提供了一个结构化的、模...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 无代码开发# 지식 검색 및 RAG 프레임워크5개월 전0984
BotSharp:基于.NET的多智能体AI应开发与管理平台综合介绍 BotSharp是基于.NET Core的一个开源项目,致力于提供一个全面的AI聊天机器人平台构建工具。它采用C#编程,支持跨平台操作,旨在简化机器学习算法的应用,使企业级开发者能够高效地将...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 지능형 신체 개발 프레임워크5개월 전0936
DCT-Net:照片和视频转绘为动漫风格化的开源工具综合介绍 DCT-Net 是一个由 DAMO 学院和北京大学王选计算机技术研究所共同开发的开源项目,旨在实现图像的动漫风格化转换。该项目利用深度学习技术,通过域校准翻译(Domain-Calibrat...최신 AI 도구# AI 이미지 스타일 제어# AI 자바 오픈 소스 프로젝트# AI 비디오 변환 스타일5개월 전01.3K
Weebo:实时语音聊天机器人,提供自然语言对话体验综合介绍 Weebo 是一个开源的实时语音聊天机器人,利用 Whisper Small 进行语音识别,Llama 3.2 进行自然语言生成,以及 Kokoro-82M 进行语音合成。该项目由 Aman...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 멀티모달 실시간 인터랙티브 제품5개월 전01.1K
OmAgent:构建多模态智能设备的智能体框架综合介绍 OmAgent是由Om AI Lab开发的一个多模态智能体框架,旨在为智能设备提供强大的AI驱动功能。该项目通过整合最先进的多模态基础模型和智能体算法,使开发者能够在各种智能设备上创建高效...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 멀티모달 실시간 인터랙티브 제품# 지능형 신체 개발 프레임워크5개월 전0954
RAIN: 실제 사람의 표정을 실시간으로 캡처하여 애니메이션 이미지의 비디오 스트림을 생성합니다.综合介绍 RAIN(Real-time Animation Of Infinite Video Stream)是一个开源项目,旨在实现实时生成无限视频流的动画效果。该项目由Pscgylotti开发,提...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 비디오 변환 스타일5개월 전01.1K
Agent Service Toolkit:基于LangGraph构建AI智能体的完整工具集综合介绍 AI Agent Service Toolkit 是一个基于LangGraph、FastAPI和Streamlit构建的完整工具集,旨在帮助开发者快速构建和运行AI代理服务。该工具包提供了一...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 지능형 신체 개발 프레임워크5개월 전0979