1-2-1-MNVTON: Imagens eficientes, experimentação virtual de roupas por pessoas em vídeos (a serem abertos)
Introdução geral 1-2-1-O MNVTON é um projeto de código aberto baseado no GitHub que visa fornecer a tecnologia "Normalização específica de modalidade para teste virtual" (MNVTON) por meio de...
Kokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozes
综合介绍 Kokoro-ONNX是一个基于ONNX runtime的开源文本转语音(TTS)工具。该项目由thewh1teagle开发,旨在提供高效、快速的语音合成解决方案。Kokoro-ONNX支持...
Zerox: PDF, DOCX, conversão de imagem para Markdown, OCR de alta precisão de modelo visual
综合介绍 Zerox是一个开源项目,旨在通过视觉模型将PDF、DOCX、图像等文件转换为Markdown格式。该项目由getomni-ai团队开发,提供了简单高效的OCR(光学字符识别)解决方案。Ze...
AIVLOG: edite automaticamente os destaques de vídeo e crie facilmente vlogs profissionais
综合介绍 AIVLOG是一款专为Vlog创作者设计的AI视频编辑工具。它能够自动分析视频内容,智能剪辑出精彩片段,节省用户95%的编辑时间。无论是日常生活、旅行记录还是谈话类视频,AIVLOG都能轻松...
Charla: uma ferramenta minimalista de bate-papo com IA baseada em endpoint com integração nativa ao back-end do Ollama
综合介绍 Charla 是一个基于终端的聊天应用程序,旨在与本地语言模型进行对话。该应用程序集成了 Ollama 后端,支持上下文感知的对话,并将聊天会话保存为 Markdown 文件。用户可以通过简...
Atualização principal do Windsurf Wave 2: apresenta a pesquisa na Web e a memória automatizada com a versão de implantação híbrida empresarial
Codeium 近日推出 Windsurf Wave 2 更新,为开发者带来多项重要功能升级,包括 Web 搜索、自动化记忆和代码执行优化等。作为AI Coding工具Top 2,这些更新旨在为 20...
O Google lança o mecanismo Vertex AI RAG: um balcão único para a criação de aplicativos generativos confiáveis e aprimorados por pesquisa
生成式 AI 和大语言模型 (LLM) 正在改变各行各业,但两个关键挑战可能会阻碍企业采用:幻觉(生成不正确或无意义的信息)和超出其训练数据的有限知识。检索增强生成 (RAG) 和 grounding...
MiniRAG: estrutura de geração aprimorada de recuperação simplificada, índice de gráfico de entidades, recordação de blocos de texto relevantes
Introdução abrangente O MiniRAG é uma estrutura extremamente simples do Retrieval Augmented Generation (RAG) que visa a permitir um bom desempenho do RAG mesmo para modelos pequenos por meio de indexação de gráficos heterogêneos e recuperação leve com aprimoramento de topologia. Ele foi desenvolvido pelo Laboratório de Ciência de Dados da Universidade de Hong Kong (HKUDS) para abordar ...
A Perplexity AI apresenta uma proposta de fusão (aquisição) com a TikTok, sediada nos EUA
要点: 据 CNBC 了解,Perplexity AI 上周六向 TikTok 的母公司字节跳动提交了一份竞标,提议 Perplexity 与 TikTok 美国业务合并。 一位熟悉情况的消息人士透露...
Omni-RGPT: um grande modelo multimodal para compreensão em nível de região de imagens e vídeos para aprimorar a análise de conteúdo visual
综合介绍 Omni-RGPT 是一个多模态大语言模型,旨在实现图像和视频的区域级理解。通过引入 Token Mark 技术,Omni-RGPT 能够在视觉特征空间内高亮目标区域,并通过区域提示(如框或...