LOADING

Sharenet
  • AI hands-on tutorials
  • AI utility commands
  • Course materials
  • AI Knowledge Base
  • AI Answers
  • I want to contribute
    • Top AI Recommendations
    • Latest AI tools
    • AI Article Writing
    • AI image generation
    • AI Video Tools
    • AI Office Efficiency
    • AI Programming Tools
    • AI design tools
    • AI chat assistant
    • AI Intelligence

    OCR

    Total 27 articles posts
    Sorting
    releaseupdateViewsLike
    Ollama OCR:使用Ollama中视觉模型提取图像中的文本

    Ollama OCR: Extracting Text from Images Using Visual Models in Ollama

    综合介绍 Ollama OCR是一个强大的光学字符识别(OCR)工具包,它利用Ollama平台提供的最先进视觉语言模型来从图像中提取文本。该项目既可作为Python包使用,也提供了用户友好的Strea...
    Latest AI tools# AI Java Open Source Projecct# OCR# Document Extraction and Cleaning
    5mos ago
    01.9K0
    Docling:支持多种格式文档解析并导出为Markdown和JSON,PDF支持OCR

    Docling: support for a variety of formats document parsing and export as Markdown and JSON, PDF support OCR

    综合介绍 Docling 是一个强大的文档解析和导出工具,支持多种文档格式,包括 PDF、DOCX、PPTX、XLSX、图像、HTML、AsciiDoc 和 Markdown。它能够将这些文档解析并导...
    Latest AI tools# AI Java Open Source Projecct# OCR# Document Extraction and Cleaning
    6mos ago
    01.8K0
    Umi-OCR:开源离线OCR软件,批量图片识别和PDF识别

    Umi-OCR: open source offline OCR software, batch image recognition and PDF recognition

    Umi-OCR 综合介绍 Umi-OCR是一款开源、免费的离线OCR软件,支持截屏、批量导入图片、PDF文档识别、排除水印和页眉页脚、扫描和生成二维码。该软件内置多国语言库,适用于Windows和Li...
    Latest AI tools# OCR
    9mos ago
    01.7K0
    Surya:专业多语言文档OCR工具,开源本地部署

    Surya: professional multilingual document OCR tool, open source native deployment

    综合介绍 Surya是一个开源的多语言文档OCR工具包,支持90多种语言的文本识别。它不仅能够进行逐行文本检测,还能进行布局分析、阅读顺序检测和表格识别。Surya的性能与云服务相媲美,适用于各种类型...
    Latest AI tools# AI Java Open Source Projecct# OCR
    8mos ago
    01.6K0
    MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

    MinerU: PDF document extraction and conversion to multimodal Markdown format, support e-book OCR scanning

    综合介绍 MinerU是由上海人工智能实验室OpenDataLab团队开发的一款开源数据提取工具,专注于从复杂的PDF文档、网页和电子书中高效提取内容。它能够将包含图片、公式、表格等元素的多模态PDF...
    Latest AI tools# AI Java Open Source Projecct# OCR# Document Extraction and Cleaning
    8mos ago
    01.6K0
    Pix2Text:开源免费图片文字识别工具

    Pix2Text: open source free image text recognition tool

    Pix2Text 综合介绍 Pix2Text (P2T) 是一个开源的免费工具,旨在替代 Mathpix,提供图片文字和数学公式识别功能。用户可以通过网页版免费使用该工具,每天最多识别 10000 个...
    Latest AI tools# OCR
    9mos ago
    01.5K0
    PixPin:长截图和动态截图,内置本地文字识别(OCR)

    PixPin: long and dynamic screenshots, built-in native text recognition (OCR)

    综合介绍 PixPin是一款功能强大的截图和贴图工具,旨在提升用户的工作效率。无论是日常办公还是专业需求,PixPin都能提供便捷的截图、贴图、长截图、文字识别(OCR)和动态截图功能。其简洁的界面和...
    Latest AI tools# OCR
    8mos ago
    01.4K0
    GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型

    GOT-OCR2.0: end-to-end multimodal OCR model based on QWen2 0.5B

    综合介绍 GOT-OCR2.0是一个阶跃星辰联合推出de 开源光学字符识别(OCR)模型,旨在通过一个统一的端到端模型推动OCR技术向OCR-2.0迈进。该模型支持多种OCR任务,包括普通文本识别、格...
    Latest AI tools# AI Java Open Source Projecct# OCR
    9mos ago
    01.4K0
    ScreenPipe:24小时收集录屏和操作信息并转换为本地知识库,通过AI助手对话、总结、回顾知识

    ScreenPipe: 24-hour collection of recorded screen and operation information and converted into a local knowledge base, through the AI assistant conversation, summarize, review knowledge

    General Description ScreenPipe is an AI assistant tool developed by mediar-ai that specializes in recording screen content, capturing screenshots and audio 24/7. It combines rewind.ai and cursor.com's...
    Latest AI tools# AI Text and Audio/Video Summarization Tool# AI Notes# OCR
    6mos ago
    01.4K0
    PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别

    PaddleOCR: A multi-language OCR tool library based on Flying Paddle, supporting recognition of more than 80 languages

    综合介绍 PaddleOCR 是一个基于 PaddlePaddle 的多语言 OCR 工具包,旨在提供实用且超轻量级的 OCR 系统。它支持超过 80 种语言的识别,并提供数据标注和合成工具,支持在服...
    Latest AI tools# AI Java Open Source Projecct# OCR
    6mos ago
    01.3K0
    Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)

    Datalab: dedicated OCR recognition AI model, PDF to Markdown (open source/API)

    综合介绍 Datalab 提供了一系列先进的AI模型,专注于OCR、布局分析、PDF转Markdown等功能。这些模型不仅性能卓越,而且易于使用,并且是开源的。平台上的Marker模型可以快速准确地将...
    Latest AI tools# AI Open Services# AI Java Open Source Projecct# OCR
    7mos ago
    01.3K0
    文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具

    Text Extraction API (text-extract-api): visual extraction of text information, anonymized PDF extraction tool

    综合介绍 文本提取API(text-extract-api)是一个强大的工具,旨在从各种文档格式(如PDF、Word、PPTX等)中提取和解析内容。该API利用最先进的光学字符识别(OCR)技术和Ol...
    Latest AI tools# AI Java Open Source Projecct# OCR# Document Extraction and Cleaning
    5mos ago
    01.3K0
    Llama OCR:利用免费Llama 3.2 Vision接口,三行代码将图像转换为Markdown的OCR库

    Llama OCR: OCR library that converts images to Markdown in three lines of code using the free Llama 3.2 Vision interface

    综合介绍 Llama OCR 是一个基于 Llama 3.2 Vision 的 OCR(光学字符识别)库,能够将文档转换为 Markdown 格式。该库由 Nutlope 开发,使用 Together...
    Latest AI tools# AI Java Open Source Projecct# OCR# Free Large Model API
    6mos ago
    01.2K0
    图片转Excel免费工具:高效识别图片中复杂格式的表格并转换为Excel文件

    Image to Excel Free Tool: Efficiently Recognize Complex Format Tables in Images and Convert to Excel File

    综合介绍 图片转Excel免费工具是一款高效的在线工具,能够快速准确地识别并转换图片中的表格数据至Excel文件。该工具支持多种图片格式,如JPG和PNG,并且可以在网页、iOS应用和Android应...
    Latest AI tools# OCR
    7mos ago
    01.2K0
    TTime:图片你文字识别和文字翻译软件

    TTime: Picture Your Text Recognition and Text Translation Software

    TTime 综合介绍 TTime 是由 InkTimeRecord 发布在 GitHub 上的项目,是一款简洁高效的翻译软件。它主要提供输入、截图、划词及悬浮球翻译等功能,支持多种翻译源和文字识别服务...
    Latest AI tools# AI Translation# OCR
    9mos ago
    01.1K0
    Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

    Chunkr: An All-in-One Service for Document Ingestion and Intelligent Chunking Based on Text Paragraph Hierarchy Using Visual Models

    综合介绍 Chunkr 是一个自托管的 API,专门用于将 PDF、PPTX、DOCX 和 Excel 文件转换为适合 RAG(检索增强生成)和 LLM(大语言模型)使用的数据。该项目由 Lumina...
    Latest AI tools# AI Java Open Source Projecct# OCR# Document Extraction and Cleaning
    6mos ago
    01.1K0
    eSearch:多功能跨平台OCR工具,集成搜索|翻译|搜图|录屏等功能

    eSearch: Multi-functional cross-platform OCR tool, integrated search | translation | search map | screen recording and other functions

    综合介绍 eSearch 是一款由 xushengfeng 开发的开源跨平台截图工具,支持 Windows、macOS 和 Linux 系统。它集成了多种功能,包括截图、OCR 识别、搜索、翻译、贴图...
    Latest AI tools# OCR
    8mos ago
    01.1K0
    ViTLP:排版复杂PDF文档提取结构化数据,视觉引导生成文本布局预训练模型

    ViTLP: Extracting Structured Data from Typographically Complex PDF Documents and Visually Guided Generation of Text Layout Pre-training Models

    综合介绍 ViTLP(Visually Guided Generative Text-Layout Pre-training for Document Intelligence)是一个开源项目,旨在通...
    Latest AI tools# OCR# Document Extraction and Cleaning
    6mos ago
    09820
    VisionParser:高精度处理收据和发票的OCR工具,提供API

    VisionParser: OCR tool for high-precision processing of receipts and invoices, API available

    综合介绍 VisionParser是一款专为处理收据和发票而设计的OCR(光学字符识别)工具。通过先进的生成式AI技术,VisionParser能够快速、准确地将各种收据和发票转换为结构化数据,适用于...
    Latest AI tools# OCR
    5mos ago
    09070
    Load More
    Sharenet
    Sharenet.ai, the best and most comprehensive AI learning guide and tool navigation. Embrace the wave of AI together!Ctrl + D or ⌘ + D Bookmark this site to your browser bookmark bar ❤️

    Friendly Link Applicationstatement denying or limiting responsibilityAdvertisement CooperationAbout Us

    Copyright © 2025 Sharenet 
    en_USEnglish
    en_USEnglishzh_CN简体中文 ja日本語 ko_KR한국어 es_ESEspañol de_DEDeutsch fr_FRFrançais pt_BRPortuguês do Brasil
    posts
    poststoolsappbook