MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

MinerU: extração e conversão de documentos PDF para o formato Markdown multimodal, suporte à digitalização OCR de e-books

综合介绍 MinerU是由上海人工智能实验室OpenDataLab团队开发的一款开源数据提取工具,专注于从复杂的PDF文档、网页和电子书中高效提取内容。它能够将包含图片、公式、表格等元素的多模态PDF...
8 meses atrás
01.6K0
ScreenPipe:24小时收集录屏和操作信息并转换为本地知识库,通过AI助手对话、总结、回顾知识

ScreenPipe: coleta de 24 horas de informações de operação e tela gravadas e convertidas em uma base de conhecimento local, por meio do diálogo, resumo e revisão do conhecimento do assistente de IA

Descrição geral O ScreenPipe é uma ferramenta de assistente de IA desenvolvida pela mediar-ai que se concentra na gravação de conteúdo de tela, capturando capturas de tela e áudio 24 horas por dia, 7 dias por semana. Ele combina os recursos do rewind.ai e do cursor.com...
6 meses atrás
01.4K0
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: um serviço completo que usa modelos visuais para a ingestão de documentos e a divisão inteligente em blocos com base na hierarquia de parágrafos do texto

综合介绍 Chunkr 是一个自托管的 API,专门用于将 PDF、PPTX、DOCX 和 Excel 文件转换为适合 RAG(检索增强生成)和 LLM(大语言模型)使用的数据。该项目由 Lumina...
6 meses atrás
01.1K0