ER NeRF:构建高保真都的说话人物视频合成系统综合介绍 ER-NeRF (Efficient Region-Aware Neural Radiance Fields)是一个开源的说话人物合成系统,发表于ICCV 2023会议。该项目利用区域感知神...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 디지털 맨5개월 전0959
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具综合介绍 JoyGen是一个创新的两阶段说话人脸视频生成框架,专注于解决音频驱动的面部表情生成问题。该项目由京东科技团队开发,采用先进的3D重建技术和音频特征提取方法,能够准确捕捉说话人的身份特征和表...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 디지털 맨5개월 전0986
OpenHands: 모든 유형의 개발자 작업을 지원하는 소프트웨어 개발을 위한 AI 기반 멀티 인텔리전트 에이전트 어시스턴트综合介绍 OpenHands 是一个由 All-Hands-AI 团队开发的开源项目,旨在通过 AI 技术简化软件开发流程。该平台前身为 OpenDevin,现已更名为 OpenHands,提供了强大...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 프로그래밍5개월 전02.1K
SP-MangaEditer: 전문 4 패널 만화 일러스트레이션 제작 도구, 이미지 생성, 만화 페이지 편집일반 소개 SP-MangaEditer는 만화 창작자를 위해 설계된 독립적인 만화 편집 플랫폼입니다. 이 플랫폼은 이미지 생성, 레이어 편집, 이미지 조정, 필터 적용 및 기타 여러 기능을 지원하여 사용자가 고품질의 만화 일러스트를 쉽게 만들 수 있도록 도와줍니다. 사용자는 간단하게 조작할 수 있습니다.최신 AI 도구# AI 이미지 생성 보조 장치# AI 자바 오픈 소스 프로젝트5개월 전01.4K
ScrapeGraphAI:一个提示词搞定网页抓取,无需编写规则智能网页内容提取工具综合介绍 ScrapeGraphAI是一个创新的Python网页抓取库,它巧妙地结合了大语言模型(LLM)和直接图逻辑来创建网站和本地文档的抓取管道。这个工具的独特之处在于它的简单性和强大功能的完美平...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리5개월 전0988
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)综合介绍 视频字幕去除工具(Video-subtitle-remover,简称VSR)是一款基于AI技术的视频处理软件,专门用于去除视频中的硬字幕和文本水印。该工具采用了多种AI算法模型(STTN、L...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 오디오/비디오 편집기5개월 전01.3K
TimesFM 2.0:谷歌开源进行时间序列预测的预训练模型综合介绍 TimesFM 2.0 - 500M PyTorch 是由 Google Research 开发的预训练时间序列基础模型,专为时间序列预测而设计。该模型能够处理长达 2048 个时间点的上下...최신 AI 도구# AI 자바 오픈 소스 프로젝트5개월 전01.1K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台综合介绍 微信视频号下载器是一个开源项目,旨在帮助用户快速下载微信视频号中的视频内容。该工具支持多种视频格式和平台,用户可以方便地在Windows和macOS系统上使用。项目由ltaoo开发,并托管在...최신 AI 도구# AI 자바 오픈 소스 프로젝트5개월 전01.3K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本综合介绍 NV Ingest(NVIDIA Ingest) 是一套早期访问的微服务,专为解析数十万复杂、混乱的非结构化 PDF 和其他企业文档而设计。它能够将这些文档转换为元数据和文本,以便嵌入到检索...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리5개월 전01.1K
"Always-On" Deepseek AI Assistant:基于Deepseek-V3打造智能语音交互系统综合介绍 Always-On AI Assistant是一个创新的AI助手项目,它通过整合Deepseek-V3、RealtimeSTT和Typer等先进技术,打造了一个功能强大的永久在线AI助理系统...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 멀티모달 실시간 인터랙티브 제품5개월 전01.9K
Ichigo(llama3-s): 로컬 실시간 음성 AI 비서, Siri의 오픈 소스 버전일반 소개 Ichigo는 텍스트 기반 언어 모델을 네이티브 '듣기' 기능으로 확장하는 것을 목표로 하는 오픈 소스 실시간 음성 AI 프로젝트입니다. 이 프로젝트는 메타의 카멜레온 논문에서 영감을 얻은 초기 융합 기술을 사용하며, Ichigo의 목표는 다음과 같습니다.최신 AI 도구# AI 자바 오픈 소스 프로젝트# 멀티모달 실시간 인터랙티브 제품5개월 전01.4K
STAR:空间时序增强AI模型,提升视频分辨率清晰度综合介绍 STAR (Spatial-Temporal Augmentation with Text-to-Video Models) 是由南京大学、字节跳动和西南大学联合开发的创新型视频超分辨率框架...최신 AI 도구# AI 이미지 확대 및 복원# AI 자바 오픈 소스 프로젝트5개월 전0989
ImBD:AI生成内容检测,检测内容是否由人工智能生成综合介绍 ImBD (Imitate Before Detect) 是一个开创性的机器生成文本检测项目,该项目发表于AAAI 2025会议。随着ChatGPT等大语言模型(LLMs)的广泛应用,识别A...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 교육 도구5개월 전01K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型综合介绍 Moondream 是一个开源的轻量级视觉语言模型,旨在通过深度学习和计算机视觉技术实现图像描述功能。该模型能够在各种平台上高效运行,特别适用于边缘设备。Moondream 采用先进的技术和...최신 AI 도구# AI 이미지 생성 보조 장치# AI 자바 오픈 소스 프로젝트5개월 전01.2K
텍스트 추출 API(text-extract-api): 텍스트 정보의 시각적 추출, 익명화된 PDF 추출 도구포괄적인 소개 텍스트 추출 API(text-extract-api)는 다양한 문서 형식(예: PDF, Word, PPTX 등)에서 콘텐츠를 추출하고 파싱하도록 설계된 강력한 도구입니다. 이 API는 최첨단 광학 문자 인식(OCR) 기술과 Ol ...최신 AI 도구# AI 자바 오픈 소스 프로젝트# OCR# 문서 추출 및 정리5개월 전01.4K
브라운챗: 오픈 소스 실시간 음성 채팅 AI 비서综合介绍 BrownChat 是一个基于大型语言模型(LLM)技术的实时音频聊天应用。该项目由 GitHub 用户 sugarforever 开发,旨在通过先进的自然语言处理技术提升用户的沟通体验。B...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 멀티모달 실시간 인터랙티브 제품5개월 전01.1K
TANGO:语音生成协调手势人像视频的工具,全身像数字人综合介绍 TANGO (Co-Speech Gesture Video Reenactment with Hierarchical Audio-Motion Embedding and Diffusi...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 디지털 맨5개월 전01.5K
Ollama OCR:使用Ollama中视觉模型提取图像中的文本综合介绍 Ollama OCR是一个强大的光学字符识别(OCR)工具包,它利用Ollama平台提供的最先进视觉语言模型来从图像中提取文本。该项目既可作为Python包使用,也提供了用户友好的Strea...최신 AI 도구# AI 자바 오픈 소스 프로젝트# OCR# 문서 추출 및 정리5개월 전02K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性综合介绍 FitDiT是一个基于扩散变换器(Diffusion Transformers)的高保真虚拟试衣系统。该项目由腾讯AI Lab开发,旨在解决传统虚拟试衣系统在展示服装细节时的局限性。FitD...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 얼굴 교체 및 드레스업5개월 전01.2K