TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: um corpo inteligente que opera computadores por meio de voz e texto e fornece feedback de voz em tempo real

综合介绍 TankWork是一个开源的桌面代理框架,旨在通过计算机视觉和系统级交互,使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机,处理实时屏幕内容,并提供连续的音频视觉...
5 meses atrás
0879
XRAG:优化检索增强生成系统的可视化评估工具

XRAG: uma ferramenta de avaliação visual para otimizar os sistemas de geração de aprimoramento de recuperação

Introdução abrangente O XRAG (eXamining the Core) é uma estrutura de benchmarking projetada para avaliar os componentes subjacentes dos sistemas avançados de geração de aumento de recuperação (RAG). Ao traçar o perfil e analisar cada módulo central, o XRAG fornece informações sobre como diferentes configurações e componentes afetam o RAG...
5 meses atrás
0996
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

CHRONOS: Ferramenta de resumo da linha do tempo de notícias para melhorar a eficiência da recuperação de notícias e da geração de linhas do tempo

综合介绍 CHRONOS是由阿里巴巴NLP团队开发的一款新闻时间线总结工具。该工具通过迭代自我提问的方式,生成新闻事件的时间线总结。CHRONOS不仅能够处理开放领域的时间线总结任务,还能在效率和可扩...
5 meses atrás
0977
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna: Vídeo de referência de retrato estático Vídeo de geração de pose para fazer as fotos de Missy dançarem

综合介绍 X-Dyna 是由字节跳动开发的一个开源项目,旨在通过零样本扩散技术生成动态人像动画。该项目利用驱动视频中的面部表情和身体动作来动画化单个人像图像,生成逼真且具有上下文感知的动态效果。X-D...
5 meses atrás
0993
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI: Criando um sistema inteligente de perguntas e respostas sobre documentos e simplesmente criando uma base de conhecimento privada na Web

Introdução abrangente O RAG Web UI é um sistema de diálogo inteligente baseado na tecnologia RAG (Retrieval Augmented Generation). Ele ajuda empresas e indivíduos a criar sistemas inteligentes de perguntas e respostas com base em sua própria base de conhecimento. Combinando a recuperação de documentos e grandes modelos de linguagem, o RAG Web UI fornece informações precisas e confiáveis...
5 meses atrás
01.2K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish: inteligências multifuncionais que revisam, validam e formatam os resultados para produzir resultados de alta qualidade

Introdução abrangente O Kheish é um agente de código aberto de múltiplas funções projetado para tarefas de modelagem de grandes linguagens (LLM) que exigem colaboração estruturada e passo a passo. O Kheish é mais do que um simples coordenador, ele é um agente inteligente por si só, solicitando módulos sob demanda, integrando a reversão do usuário...
5 meses atrás
0910
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

AI ContentCraft: uma ferramenta versátil de criação de conteúdo de IA para gerar histórias curtas, roteiros de diálogos, narrações e gráficos

综合介绍 AI ContentCraft 是一个多功能的内容创作工具,集成了文本生成、语音合成、图像生成等功能。它可以帮助创作者快速生成故事、播客脚本和配套的音视频内容。该工具支持多种语言转换,能够批...
5 meses atrás
01.1K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: criação de gráficos de conhecimento e mecanismos de pesquisa pessoal executados localmente

Introdução geral O Unigraph é um mecanismo de pesquisa pessoal e gráfico de conhecimento de propósito geral local, projetado para fornecer aos usuários um espaço de trabalho integrado para ajudar a gerenciar e pesquisar uma ampla variedade de dados em suas vidas pessoais. Com o Unigraph, os usuários podem integrar dados de diferentes fontes em um...
5 meses atrás
0992