RAGアプリケーションに最適なエンベデッドモデルの選び方向量Embedding是目前检索增强生成(RAG)应用程序的核心。它们捕获数据对象(如文本,图像等)的语义信息,并以数字数组表示。在时下的生成式AI应用中,这些向量Embedding通常由Embedd...AI知識ベース5ヶ月前09960
正しいエンベデッドモデルを選ぶには?检索增强生成(RAG)是生成式 AI (GenAI)中的一类应用,支持使用自己的数据来增强 LLM 模型(如 ChatGPT)的知识。 RAG 通常会用到三种不同的AI模型,即 Embedding 模...AI知識ベース5ヶ月前07870
DB-GPTの実世界シナリオにおけるRAG最適化に関する10,000語の記事。前言 在过去两年中,检索增强生成(RAG,Retrieval-Augmented Generation)技术逐渐成为提升智能体的核心组成部分。通过结合检索与生成的双重能力,RAG能够引入外部知识,从而...AI知識ベース5ヶ月前09120
2025年に参入する価値のあるAIエージェントのフレームワーク トップ5Agent 目前我见到的最多的翻译是“智能体”,但是直译是“代理”。 那 Agentic 又要翻译成什么呢?我感觉“代理型”这样的词更合适。 所以为了不让读者混淆,我在本文直接用英文表示。 随着 ...AI知識ベース5ヶ月前02.1K0
初心者でも理解できる大規模なモデル微調整の知識ポイント大模型微调全流程 建议在微调过程中严格按照以上流程执行,避免跳步,否则可能导致无效劳动。比如,如果没有充分构建数据集,最终发现微调模型效果不佳是数据集质量的问题,那么前期的努力将付诸东流,事倍功半...AI知識ベース5ヶ月前09080
LLMベースのText-to-SQLの開発プロセスを整理する1万字の記事OlaChat AI数智助手万字长文深度解析,带你了解Text-to-SQL技术的前世今生。 论文:Next-Generation Database Interfaces: A Survey of L...AI知識ベース5ヶ月前09080
レイト・チャンキング×ミルバス:RAGの精度を高める方法01.背景 在RAG应用开发中,第一步就是对于文档进行chunking(分块),高效的文档分块,可以有效的提高后续的召回内容的准确性。而对于如何高效的分块是个讨论的热点,有诸如固定大小分块,随机大小分...AI知識ベース6ヶ月前09980
2024 RAG目録、RAG応用戦略 100以上 回顾2024,大模型日新月异,智能体百家争鸣。作为AI应用的重要组成部分,RAG也是“群雄逐鹿,诸侯并起”。年初ModularRAG持续升温、GraphRAG大放异彩,年中开源工具如火如荼、知识图...AI知識ベース6ヶ月前01.3K0
大規模モデルの構造化データ出力方法:LLM JSONリソースの厳選リスト此精选列表专注于使用大语言模型(LLM)生成 JSON 或其他结构化输出的相关资源。 通过函数调用、工具、CFG 等方式使用 LLM 生成 JSON 的资源列表,涵盖库、模型、Notebooks 等...AI知識ベース6ヶ月前01.5K0
AI教育トラック1万字分析:代表的な製品は何か?チャンスは何か?将来の可能性は?教育一直被认为是会被LLM改变最大的行业之一。ChatGPT 的使用场景中,教育占据了很大比重,其用量常随开学和假期规律波动。而 Andrej Karpathy 也选择了教育作为他的创业方向。人们都期...AI知識ベース6ヶ月前01K0
人間工学の専門家がプロンプト・エンジニアリングについて語るAI总结 概述 AI 提示工程 的深入探讨,通过一个圆桌会议的形式,多位来自 Anthropic 的专家从研究、消费和企业等不同角度分享了他们对提示工程的理解和实践经验。 文章详细阐述了提示工程的定义...AI知識ベース6ヶ月前09220
テスト時間計算のスケーリング:ベクトル・モデルに関する思考の連鎖自从 OpenAI 发布了 o1 模型后,Scaling Test-Time Compute(扩展推理时计算)就成了 AI 圈子里最火爆的话题之一。简单来说,与其在预训练或后训练阶段疯狂堆算力,不如在...AI知識ベース6ヶ月前01.5K0
ロールアップ長文ベクトルモデル チャンキング戦略 コンペティション长文本向量模型能够将十页长的文本编码为单个向量,听起来很强大,但真的实用吗? 很多人觉得... 未必。 直接用行不行?该不该分块?怎么分才最高效?本文将带你深入探讨长文本向量模型的不同分块策略,分析利...AI知識ベース6ヶ月前08970
LLMキューを効果的にテストする方法 - 理論から実践まで完全ガイド 一、测试提示词的根本原因: LLM 对提示词高度敏感,细微的措辞变化可能导致显著不同的输出结果 未经测试的提示词可能产生: 事实错误的信息 不相关的回复 不必要的 API 成本浪费 二、系统化的提...AI知識ベース6ヶ月前08340
AIエンジニアリング・アカデミー: 知能体をエンジニアリングするための4つのガイド欢迎来到 AI 工程学院的 AI 代理部分!本模块探索 AI 代理的迷人世界,从基本模式到实际应用。学习如何创建、协调和部署智能代理,这些代理能够执行复杂任务并对其环境进行推理。 📚 仓库结构 类...AI知識ベース6ヶ月前08710
AI工学研究所:3ファインチューニング(大規模言語モデルの微調整)📚 资料库结构 模型/目录 描述与内容 Axolotl 用于微调语言模型的框架 Gemma Google 最新的大语言模型实现 - finetune-gemma.ipynb - gemma-sft.p...AI知識ベース6ヶ月前09070
AIエンジニアリング・アカデミー:2.18Vision RAG ビジョン機能笔记:https://colab.research.google.com/github/run-llama/llama_index/blob/main/docs/docs/examples/multi...AI知識ベース6ヶ月前08600
AI工学アカデミー:2.17 マルチ・ドキュメント・エージェント型RAG(マルチ・ドキュメント・インテリジェント検索強化型ジェネレーション) 引言 基于智能体方法提升检索增强生成能力。多文档智能检索增强生成(Multi-Document Agentic RAG, Retrieval Augmented Generation)是一种先进的...AI知識ベース6ヶ月前09140
AI工学アカデミー: 2.16 GraphRAG (グラフ構造に基づく検索補強生成法) 引言 GraphRAG(基于图结构的检索增强生成)是一种先进的检索与生成方法。它结合了图数据结构的优势和大语言模型(LLM)的能力,克服了传统 RAG 系统的一些限制。 https://githu...AI知識ベース#ナレッジグラフ6ヶ月前09020