로드 중

Sharenet
  • AI 실습 튜토리얼
  • AI 유틸리티 명령
  • 코스 정보
  • AI 기술 자료
  • AI 답변
  • 기여하고 싶습니다.
    • 최고의 AI 추천
    • 최신 AI 도구
    • AI 기사 작성
    • AI 이미지 생성
    • AI 비디오 도구
    • AI 오피스 효율성
    • AI 프로그래밍 도구
    • AI 디자인 도구
    • AI 채팅 도우미
    • AI 인텔리전스

    문서 추출 및 정리

    총 67개 기사
    순서대로 정렬
    post업데이트훑어보기kudos
    OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

    OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

    综合介绍 OmniParse是一个强大的数据解析与优化平台,旨在将任何非结构化数据转换为结构化、可操作的数据,优化后适用于GenAI(生成式人工智能)框架。无论是处理文档、表格、图像、视频、音频文件还...
    최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리
    7개월 전
    01.1K0
    Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

    Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

    综合介绍 Chunkr 是一个自托管的 API,专门用于将 PDF、PPTX、DOCX 和 Excel 文件转换为适合 RAG(检索增强生成)和 LLM(大语言模型)使用的数据。该项目由 Lumina...
    최신 AI 도구# AI 자바 오픈 소스 프로젝트# OCR# 문서 추출 및 정리
    6개월 전
    01.1K0
    Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出

    Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出

    综合介绍 Outlines 是一个由 dottxt-ai 开发的开源库,旨在通过结构化文本生成来提升大语言模型(LLM)的应用能力。该库支持多种模型集成,包括 OpenAI、transformers...
    최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리
    4개월 전
    01.1K0
    pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

    pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

    综合介绍 pdf2htmlEX 是一个开源工具,旨在将 PDF 文件转换为 HTML 格式,通过分析 PDF 文件的内容并使用 HTML + CSS 精确还原其视觉效果, 将 PDF 文档转换为浏览器...
    최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리
    6개월 전
    01.1K0
    Vision Parse:使用视觉语言模型将PDF文档智能转换为Markdown格式

    Vision Parse:使用视觉语言模型将PDF文档智能转换为Markdown格式

    综合介绍 Vision Parse是一个革命性的文档处理工具,它巧妙地结合了最先进的视觉语言模型(Vision Language Models)技术,能够将PDF文档智能转换为优质的Markdown格...
    최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리
    5개월 전
    01.1K0
    NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

    NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

    综合介绍 NV Ingest(NVIDIA Ingest) 是一套早期访问的微服务,专为解析数十万复杂、混乱的非结构化 PDF 和其他企业文档而设计。它能够将这些文档转换为元数据和文本,以便嵌入到检索...
    최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리
    5개월 전
    01.1K0
    TextIn:通用文档转换,PDF转Markdown工具

    TextIn:通用文档转换,PDF转Markdown工具

    综合介绍 TextIn是一款专业的PDF转Markdown工具,旨在帮助用户高效地将PDF文档转换为Markdown格式。该工具支持多种文件格式,操作简单,转换速度快,能够保留原始PDF的格式和内容...
    최신 AI 도구# 문서 추출 및 정리
    7개월 전
    01K0
    E2M:将多种文件格式转换为Markdown,轻松实现文档格式统一

    E2M:将多种文件格式转换为Markdown,轻松实现文档格式统一

    综合介绍 E2M(Everything to Markdown)是一个开源的Python库,旨在将多种文件格式转换为Markdown格式。该工具支持包括doc、docx、epub、html、htm、u...
    최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리
    6개월 전
    01K0
    Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

    Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

    综合介绍 Zerox是一个开源项目,旨在通过视觉模型将PDF、DOCX、图像等文件转换为Markdown格式。该项目由getomni-ai团队开发,提供了简单高效的OCR(光学字符识别)解决方案。Ze...
    최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리
    5개월 전
    01K0
    ViTLP:排版复杂PDF文档提取结构化数据,视觉引导生成文本布局预训练模型

    ViTLP:排版复杂PDF文档提取结构化数据,视觉引导生成文本布局预训练模型

    综合介绍 ViTLP(Visually Guided Generative Text-Layout Pre-training for Document Intelligence)是一个开源项目,旨在通...
    최신 AI 도구# OCR# 문서 추출 및 정리
    6개월 전
    09960
    LlamaParse:Llamaindex推出的高品质解析文档,提取数据服务(每日免费提取1000页)

    LlamaParse:Llamaindex推出的高品质解析文档,提取数据服务(每日免费提取1000页)

    综合介绍 LlamaParse 是一个强大的文档解析工具,能够处理复杂的文档如 PDF、PowerPoint、Word 文档和电子表格,并将其转换为结构化数据。LlamaParse 提供多种使用方式...
    최신 AI 도구# AI 오픈 서비스# 문서 추출 및 정리
    4개월 전
    09920
    Doc2X:文档图片公式识别与转换工具,支持多格式转换与高精度翻译

    Doc2X:文档图片公式识别与转换工具,支持多格式转换与高精度翻译

    综合介绍 Doc2X 是一款功能强大的文档图片公式识别与转换工具,致力于提供高效智能的文档处理解决方案。无论是学术科研论文、教辅书籍、企业文档还是财报研报,Doc2X 都能精准识别 PDF 中的表格和...
    최신 AI 도구# AI 오픈 서비스# AI 번역# 문서 추출 및 정리
    4개월 전
    09880
    Yek:读取git仓库文本文件并快速分块,以供大模型使用

    Yek: git 리포지토리 텍스트 파일을 읽고 대형 모델을 위해 빠르게 청크 처리하기

    综合介绍 Yek 是一个基于 Rust 的快速工具,用于读取存储库或目录中的文本文件,将其分块并序列化以供大型语言模型(LLM)使用。该工具默认使用 .gitignore 规则跳过不需要的文件,并利用...
    최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리
    4개월 전
    09830
    SemHash:快速实现语义文本去重,提升数据清理效率

    SemHash:快速实现语义文本去重,提升数据清理效率

    综合介绍 SemHash 是一个轻量级且灵活的工具,用于通过语义相似性来去重数据集。它结合了 Model2Vec 的快速嵌入生成和 Vicinity 的高效 ANN(近似最近邻)相似性搜索。SemHa...
    최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리
    5개월 전
    09540
    Trieve:提供搜索、推荐和分析的全方位RAG云基础设施

    Trieve:提供搜索、推荐和分析的全方位RAG云基础设施

    综合介绍 Trieve 是由 Devflow, Inc. 开发的全方位基础设施,专为搜索、推荐、RAG(检索增强生成)和分析而设计。该平台通过 API 提供服务,支持自托管,适用于 AWS、GCP、K...
    최신 AI 도구# AI 오픈 서비스# 문서 추출 및 정리
    6개월 전
    09450
    Parseur:自动化提取文档数据,各类文档中提取结构化文本

    Parseur:自动化提取文档数据,各类文档中提取结构化文本

    综合介绍 Parseur是一款领先的AI数据提取软件,旨在帮助用户从PDF、电子邮件和其他文档中自动提取文本数据。通过Parseur,用户可以轻松地将非结构化数据转换为结构化数据,并将其发送到各种应用...
    최신 AI 도구# 문서 추출 및 정리
    5개월 전
    09400
    ScrapeGraphAI:一个提示词搞定网页抓取,无需编写规则智能网页内容提取工具

    ScrapeGraphAI:一个提示词搞定网页抓取,无需编写规则智能网页内容提取工具

    综合介绍 ScrapeGraphAI是一个创新的Python网页抓取库,它巧妙地结合了大语言模型(LLM)和直接图逻辑来创建网站和本地文档的抓取管道。这个工具的独特之处在于它的简单性和强大功能的完美平...
    최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리
    5개월 전
    09180
    HtmlRAG:构建高效HTML检索增强生成系统,优化RAG系统中的HTML文档检索与处理

    HtmlRAG: 효율적인 HTML 검색 강화 생성 시스템 구축, RAG 시스템에서 HTML 문서 검색 및 처리 최적화

    综合介绍 HtmlRAG是一个创新的开源项目,专注于改进检索增强生成(RAG)系统中的HTML文档处理方法。该项目提出了一种新颖的方法,认为在RAG系统中使用HTML格式比纯文本更有效。项目包含了完整...
    최신 AI 도구# 문서 추출 및 정리# 지식 검색 및 RAG 프레임워크
    5개월 전
    09150
    PPTX2MD:将PPTX文件转换为Markdown的专用工具

    PPTX2MD: PPTX 파일을 마크다운으로 변환하는 특수 도구

    综合介绍 PPTX2MD是一个开源工具,旨在将PowerPoint的PPTX文件转换为Markdown格式。该工具由GitHub用户ssine开发,支持保留标题、列表、文本格式(如粗体、斜体、颜色和超...
    최신 AI 도구# AI 자바 오픈 소스 프로젝트# 문서 추출 및 정리
    4개월 전
    08920
    더 보기
    Sharenet
    Sharenet.ai, 가장 포괄적인 AI 학습 가이드 및 도구 탐색. 인공지능의 물결을 함께 맞이하세요! 브라우저 북마크 바에 이 사이트 북마크 추가 ❤️

    친숙한 링크 애플리케이션책임을 부인하거나 제한하는 진술광고 협력회사 소개

    저작권 © 2025 Sharenet 
    ko_KR한국어
    ko_KR한국어zh_CN简体中文 en_USEnglish ja日本語 es_ESEspañol de_DEDeutsch fr_FRFrançais pt_BRPortuguês do Brasil
    글쓰기
    글쓰기웹 주소하드웨어책