LOADING

Sharenet
  • AI实操教程
  • AI实用指令
  • 课程资料
  • AI知识库
  • AI答疑
  • 我要投稿
    • 热门AI推荐
    • 最新AI工具
    • AI文章写作
    • AI图像生成
    • AI视频工具
    • AI办公效率
    • AI编程工具
    • AI设计工具
    • AI聊天助手
    • AI智能体

    文档提取与清洗

    共 67 篇文章
    排序
    发布更新浏览点赞
    Parsio:自动从 PDF、电子邮件和其他文档中提取关键结构化数据

    Parsio:自动从 PDF、电子邮件和其他文档中提取关键结构化数据

    综合介绍 Parsio 是一款基于 AI 技术的文档和邮件数据提取工具,能够自动从 PDF、电子邮件及其他文档中提取结构化数据。该平台提供强大的 PDF 解析器和 OCR 功能,支持多种文档类型,包括...
    最新AI工具# 文档提取与清洗
    7个月前
    01.2K0
    Chonkie:轻量级RAG文本切块库

    Chonkie:轻量级RAG文本切块库

    综合介绍 Chonkie 是一个轻量级且高效的 RAG(Retrieval-Augmented Generation)文本切块库,旨在帮助开发者快速、简便地对文本进行分块处理。该库支持多种分块方法,包...
    最新AI工具# AI开源项目# 文档提取与清洗
    4个月前
    01.3K0
    TextIn:通用文档转换,PDF转Markdown工具

    TextIn:通用文档转换,PDF转Markdown工具

    综合介绍 TextIn是一款专业的PDF转Markdown工具,旨在帮助用户高效地将PDF文档转换为Markdown格式。该工具支持多种文件格式,操作简单,转换速度快,能够保留原始PDF的格式和内容...
    最新AI工具# 文档提取与清洗
    7个月前
    01K0
    文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具

    文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具

    综合介绍 文本提取API(text-extract-api)是一个强大的工具,旨在从各种文档格式(如PDF、Word、PPTX等)中提取和解析内容。该API利用最先进的光学字符识别(OCR)技术和Ol...
    最新AI工具# AI开源项目# OCR# 文档提取与清洗
    5个月前
    01.3K0
    Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)

    Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)

    综合介绍 Datalab 提供了一系列先进的AI模型,专注于OCR、布局分析、PDF转Markdown等功能。这些模型不仅性能卓越,而且易于使用,并且是开源的。平台上的Marker模型可以快速准确地将...
    最新AI工具# AI开放服务# AI开源项目# OCR
    7个月前
    01.3K0
    MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

    MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

    综合介绍 MinerU是由上海人工智能实验室OpenDataLab团队开发的一款开源数据提取工具,专注于从复杂的PDF文档、网页和电子书中高效提取内容。它能够将包含图片、公式、表格等元素的多模态PDF...
    最新AI工具# AI开源项目# OCR# 文档提取与清洗
    8个月前
    01.6K0
    Marker:快速将PDF转换为Markdown的开源工具

    Marker:快速将PDF转换为Markdown的开源工具

    综合介绍 Marker 是一个基于深度学习的文档处理工具,旨在将 PDF 文件快速准确地转换为 Markdown 格式。它支持多种文档类型,特别优化了书籍和科学论文的转换。Marker 能够去除页眉页...
    最新AI工具# AI开源项目# 文档提取与清洗
    3个月前
    01.6K0
    Mathpix:PDF和图片文档结构化转换软件,支持多终端

    Mathpix:PDF和图片文档结构化转换软件,支持多终端

    综合介绍 Mathpix 是一款强大的 AI 驱动文档自动化工具,专为科研人员、开发者和企业设计。它能够快速准确地将 PDF 和图像转换为可搜索、可导出和机器可读的文本。Mathpix 提供了多种功能...
    最新AI工具# AI开放服务# 文档提取与清洗
    9个月前
    01.5K0
    Unstructured:开源预处理非结构化文档,无结构数据处理的利器

    Unstructured:开源预处理非结构化文档,无结构数据处理的利器

    综合介绍 Unstructured-IO 提供了一系列开源组件,用于处理和预处理图像和文本文档,如 PDF、HTML、Word 文档等。其主要目标是简化和优化数据处理工作流程,特别是为大语言模型(LL...
    最新AI工具# AI开源项目# 文档提取与清洗
    9个月前
    01.2K0
    Reader API:网页内容提取工具,HTML转换为Markdown格式

    Reader API:网页内容提取工具,HTML转换为Markdown格式

    综合介绍 Jina AI的Reader项目是一个开源工具(Reader 开源地址),可将任何URL通过添加前缀https://r.jina.ai/转换成适合大型语言模型(Large Languag...
    最新AI工具# AI开源项目# 文档提取与清洗
    9个月前
    01.4K0
    没有了
    Sharenet
    Sharenet.ai,最好最全的AI学习指南与工具导航。一起拥抱人工智能浪潮!Ctrl + D 或 ⌘ + D 收藏本站到浏览器书签栏❤️

    友链申请免责声明广告合作关于我们

    Copyright © 2025 Sharenet 
    zh_CN简体中文
    zh_CN简体中文en_USEnglish ja日本語 ko_KR한국어 es_ESEspañol de_DEDeutsch fr_FRFrançais pt_BRPortuguês do Brasil
    文章
    文章网址软件书籍