SHMT: 자체 감독 계층적 메이크업 전송 모델, 가상 메이크업, 새로운 인물 사진으로의 메이크업 마이그레이션综合介绍 SHMT(Self-supervised Hierarchical Makeup Transfer)是一个基于潜在扩散模型的自我监督分层化妆迁移项目,旨在通过无监督学习方法实现化妆效果的高质...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 얼굴 교체 및 드레스업5개월 전01.1K
VITA:开源视觉与语音实时交互的多模态大语言模型综合介绍 VITA是一个领先的开源交互式多模态大语言模型项目,率先实现了真正的全方位多模态交互能力。该项目于2024年8月推出VITA-1.0版本,开创了首个开源交互式全模态大语言模型的先河。2024...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 멀티모달 실시간 인터랙티브 제품5개월 전01.3K
크리스퍼위스퍼: 정확한 축어체 음성 전사 도구综合介绍 CrisperWhisper 是一个基于 OpenAI Whisper 的高级语音识别工具,专注于快速、精确和逐字的语音转录。它能够提供精确的单词级时间戳,甚至在语音填充和停顿的情况下也能准...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 음성-텍스트 변환5개월 전01.6K
AI 지마쿠 구미: AI의 도움으로 동영상에 대한 다국어 자막 자동 생성 및 번역综合介绍 AI no jimaku gumi(AI の字幕組)是一个强大的命令行视频字幕处理工具,专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术,包括 Whisper 语音...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 번역# AI 음성-텍스트 변환5개월 전01.1K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具综合介绍 TransRouter 是一个基于 Google Gemini 大模型的实时语音翻译工具,专门设计用于实现中英文之间的实时语音互译。该工具能够无缝集成到 Zoom 等视频会议软件中,为跨语言...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 멀티모달 실시간 인터랙티브 제품5개월 전01K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现综合介绍 开源NotebookLM是一个创新的人工智能项目,它结合了Deepseek-V3的语言理解能力和PlayHT的语音合成技术,旨在创建一个智能化的笔记对话系统。该项目由Build Fast w...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 텍스트 및 오디오/비디오 요약 도구5개월 전01.4K
Diffbot GraphRAG LLM: 외부 실시간 지식 그래프 데이터에 기반한 LLM 추론 서비스종합 소개 Diffbot LLM Reasoning Server는 LLama 모델 아키텍처를 기반으로 특별한 최적화와 개선이 이루어진 혁신적인 대규모 언어 모델링 시스템입니다. 이 프로젝트의 가장 중요한 특징은 실시간 지식 그래프와 검색 기능이 강화된 생성 기능을 통합한 것입니다.최신 AI 도구# AI 자바 오픈 소스 프로젝트# 지식 그래프# 지식 검색 및 RAG 프레임워크5개월 전01.3K
JupyterLab Magic Wand:在JupyterLab中使用AI助手提升工作效率综合介绍 JupyterLab Magic Wand是一个实验性的JupyterLab扩展,旨在为JupyterLab笔记本提供内嵌的AI助手功能。该扩展由Zsailer开发,主要用于提升数据科学家和...최신 AI 도구# AI 자바 오픈 소스 프로젝트5개월 전0992
LuminaBrush:使用智能绘画工具为图像添加照明打光效果综合介绍 LuminaBrush 是一个创新的交互式图像照明效果编辑工具,由人工智能技术驱动。该项目采用两阶段框架处理图像:第一阶段将输入图像转换为"均匀照明"的外观,第二阶段则根据用户的涂鸦操作生成...최신 AI 도구# AI 이미지 스타일 제어# AI 자바 오픈 소스 프로젝트5개월 전01.8K
Groq AppGen: Groq API를 사용하여 Llama 3.3 70B HTML 코드 생성 기능을 시연하는 실험 프로젝트综合介绍 Groq AppGen 是一个创新的交互式网页应用生成器,由 Groq 公司开发并开源。该项目展示了 Llama 3.3 70B 模型在 HTML 代码生成方面的强大能力。通过集成 Groq...최신 AI 도구# AI 자바 오픈 소스 프로젝트5개월 전01.1K
llms.txt 생성기: 웹사이트 콘텐츠를 빠르게 캡처하고 LLM 교육 텍스트 데이터 세트를 생성합니다.综合介绍 llmstxt-generator 是一个专业的网站内容提取和整合工具,专门为大语言模型(LLM)的训练和推理准备高质量文本数据集。该工具由 Mendable AI 开发,采用 @firec...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리5개월 전01.3K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型综合介绍 Raycast-G4F(GPT4Free) 是一款强大的 Raycast 扩展工具,让用户可以免费访问包括 GPT-4、Llama-3 在内的多种高级 AI 模型。该扩展不仅提供了实时对话流...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 현지화 채팅 애플리케이션# 무료 대형 모델 API5개월 전01.2K
Gemini 검색: Gemini 2.0 Flash에 내장된 퍼플렉서티 스타일의 AI 검색 엔진综合介绍 Gemini-Search 是一个基于 Google Gemini 2.0 技术打造的开源智能搜索引擎项目。该项目采用 TypeScript 开发,致力于复制 Perplexity 搜索引擎...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 검색 도구5개월 전01.2K
Devin.cursorrules: 커서 IDE 개발 환경 개선, 커서/윈드서핑을 Devin과 같은 지능형 프로그래밍 도우미로 만들기일반 소개 Devin.cursorrules는 저렴한 커서 또는 윈드서프 IDE(~$20)를 Devin과 같은 강력한 AI 프로그래밍 도우미로 변환하도록 설계된 혁신적인 오픈 소스 프로젝트입니다. 이 프로젝트는 일련의 ...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 프로그래밍5개월 전01.4K
One Hub:管理和分发OpenAI接口,支持多种模型和统计功能综合介绍 One Hub 是一个基于 One API 二次开发的 OpenAI 接口管理和分发系统。该项目由 MartialBE 开发,旨在提供更广泛的模型支持和更完善的统计功能。One Hub 具有...최신 AI 도구# AI 자바 오픈 소스 프로젝트6개월 전0974
Fish Agent: 엔드투엔드 AI 음성 복제 어시스턴트, 실시간 음성 대화 어시스턴트, Fish Speech 스핀오프 프로젝트종합 소개 물고기 음성 파생 프로젝트 물고기 에이전트는 V0.1 3B 모델 아키텍처를 기반으로 개발된 혁신적인 엔드투엔드 AI 음성 복제 시스템입니다. 완전한 엔드투엔드 음성 복제 처리 시스템으로서, 가장 중요한 특징은 혁신적인 말없는 ...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 음성 복제# 멀티모달 실시간 인터랙티브 제품6개월 전01.1K
스토리 어댑터: 긴 스토리를 기반으로 연속적이고 일관된 그래픽 일러스트를 생성합니다.综合介绍 Story-Adapter 是一个创新的故事可视化框架,它能够将文本故事转换为连贯的图像序列。这个项目由研究人员开发,采用了无需训练的迭代方法来生成高质量的故事插图。该框架的特点是能够处理长...최신 AI 도구# AI 이미지 스타일 제어# AI 자바 오픈 소스 프로젝트6개월 전01.3K
小红书AI运营助手:自动生成和发布小红书文章综合介绍 小红书AI运营助手(xhsaipublisher)是一个专为在小红书平台上发布文章而设计的自动化工具。该项目结合了图形用户界面与自动化脚本,利用大模型技术生成内容,并通过浏览器自动登录和发布...최신 AI 도구# AI 부업 수익 창출 프로젝트# AI 자바 오픈 소스 프로젝트6개월 전01.3K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪综合介绍 FunClip是一款完全开源的本地化自动视频剪辑工具,由阿里巴巴达摩院TONGYI语音实验室开发。该工具集成了工业级的 Paraformer-Large 语音识别模型,可以准确识别视频中的语...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 음성-텍스트 변환# AI 오디오/비디오 편집기6개월 전01.1K