LOADING

Sharenet
  • AI hands-on tutorials
  • AI utility commands
  • Course materials
  • AI Knowledge Base
  • AI Answers
  • I want to contribute
    • Top AI Recommendations
    • Latest AI tools
    • AI Article Writing
    • AI image generation
    • AI Video Tools
    • AI Office Efficiency
    • AI Programming Tools
    • AI chat assistant
    • AI Intelligence
    • AI design tools
    • AI音频工具
    • AI search engine
    • AI学习资源

    Document Extraction and Cleaning

    Total 67 articles posts
    Sorting
    releaseupdateViewsLike
    CodeWeaver:将代码结构和内容自动生成Markdown文档

    CodeWeaver: Automatically generate Markdown documents from code structure and content.

    综合介绍 CodeWeaver 是一个命令行工具,旨在将代码库编织成单个、易于浏览的Markdown文档。它通过递归扫描目录,生成项目文件层次结构的结构化表示,并在代码块中嵌入每个文件的内容。这款工具...
    Latest AI tools# AI Java Open Source Projecct# Document Extraction and Cleaning
    4mos ago
    05420
    pure.md:网址前插入“pure.md/”即可提取干净的文本

    pure.md: insert "pure.md/" in front of the URL to extract clean text.

    综合介绍 pure.md 是一个为 AI 代理和开发者设计的工具,主打快速将网页内容或文件转为 Markdown 格式。它通过代理服务绕过反爬虫限制,提取网页核心数据,并输出简洁的 Markdown ...
    Latest AI tools# AI Open Services# Document Extraction and Cleaning
    2mos ago
    05130
    Cloudsquid:上传文档并描述要求智能提取结构化数据

    Cloudsquid: upload documents and describe requirements for intelligent extraction of structured data

    综合介绍 Cloudsquid 是一家 2023 年成立于德国柏林的公司,专注于用人工智能简化文件处理。它的核心产品是一个在线数据提取平台,用户只需上传 PDF、图片、音频、视频等文件,简单说明需要提...
    Latest AI tools# Document Extraction and Cleaning
    2mos ago
    05110
    Supametas.AI:提取非结构化数据为LLM高可用数据

    Supametas.AI: Extracting Unstructured Data into LLM Highly Available Data

    综合介绍 Supametas.AI 是一个数据处理平台,专门把网页、文档、音视频等杂乱信息整理成AI能用的结构化数据。它支持从多个来源收集数据,包括网页链接、API、本地文件等,然后输出为 JSON ...
    Latest AI tools# AI Open Services# Document Extraction and Cleaning
    2mos ago
    05060
    飞桨 PP-TableMagic:复杂表格结构化信息提取神器

    Flying Paddle PP-TableMagic: Structured Information Extraction for Complex Tables

    表格识别的目标是解析图片中的表格,准确识别表格结构和单元格位置,并将其还原为结构化的表格格式(例如 HTML)。在当今信息化时代,大量重要的表格数据仍以非结构化状态存在(如扫描文档中的信息统计表图片...
    Latest AI tools# AI Java Open Source Projecct# Document Extraction and Cleaning
    3mos ago
    05060
    自动解析PDF内容并提取文字与表格的开源服务

    Automatically parse PDF content and extract text and tables of open source services

    综合介绍 它能自动分析PDF文档的布局,识别页面中的文字、标题、图片、表格、公式等元素,并判断它们的正确顺序。工具支持OCR功能,可以把扫描PDF转为可搜索文本。它基于Docker运行,提供两种模型...
    Latest AI tools# AI Java Open Source Projecct# OCR# Document Extraction and Cleaning
    2mos ago
    04020
    DevDocs:快速抓取并整理技术文档的MCP服务

    DevDocs: an MCP service for quickly crawling and organizing technical documentation

    综合介绍 DevDocs 是一个完全免费的开源工具,由 CyberAGI 团队开发,托管在 GitHub 上。它专为程序员和软件开发者设计,能从技术文档的网址开始,自动爬取相关页面并整理成简洁的 Ma...
    Latest AI tools# AI Java Open Source Projecct# MCP services# Document Extraction and Cleaning
    2mos ago
    03650
    Chatlog:提取和查询微信聊天记录的开源工具

    Chatlog: extract and query WeChat chat logs of open source tools

    综合介绍 Chatlog 是一个开源工具,专注于从微信本地数据库提取和查询聊天记录。它支持微信 3.x 和 4.0 版本,覆盖 Windows 和 macOS 系统。用户可以通过命令行、终端界面或 H...
    Latest AI tools# AI Java Open Source Projecct# MCP services# Document Extraction and Cleaning
    2mos ago
    03550
    VOP:提取复杂图表与数学公式的OCR工具

    VOP: OCR Tool for Extracting Complex Diagrams and Math Formulas

    综合介绍 Versatile OCR Program 是一个开源的光学字符识别(OCR)工具,专门为处理复杂的学术和教育文档设计。它能从PDF、图像等文件中提取文本、表格、数学公式、图表和示意图,并生...
    Latest AI tools# AI Java Open Source Projecct# OCR# Document Extraction and Cleaning
    2mos ago
    03260
    OneFileLLM:整合多种数据源为单一文本文件

    OneFileLLM: Integrating Multiple Data Sources into a Single Text File

    综合介绍 OneFileLLM 是一个开源命令行工具,旨在将多种数据源整合成单一文本文件,方便输入大语言模型(LLM)。它支持处理 GitHub 仓库、ArXiv 论文、YouTube 视频转录、网页...
    Latest AI tools# AI Java Open Source Projecct# Document Extraction and Cleaning
    2mos ago
    02780
    No more
    Sharenet
    Sharenet.ai,最好最全的AI学习指南与工具导航。致力于帮助学习者在人工智能领域从零开始,逐步迈向精通!Sharenet还提供了便捷的资源获取渠道。AI时代,分享为王!Ctrl + D 或 ⌘ + D 收藏本站到浏览器书签栏❤️

    Friendly Link Applicationstatement denying or limiting responsibilityAdvertisement CooperationAbout Us

    Copyright © 2025 Sharenet 
    en_USEnglish
    en_USEnglishzh_CN简体中文 ja日本語 ko_KR한국어 es_ESEspañol de_DEDeutsch fr_FRFrançais pt_BRPortuguês do Brasil
    posts
    poststoolsappbook