Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: 高品質音声生成とクローニングのためのオープンソース音声合成モデル

概要 Llasa-3Bは、香港科学技術大学オーディオ研究室(HKUST Audio)が開発したオープンソースの音声合成(TTS)モデルです。このモデルはLlama 3.2Bアーキテクチャに基づいており、複数の音声合成をサポートするだけでなく、高品質な音声合成を提供するために慎重に調整されています。
6ヶ月前
01.4K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务

Goose:全工程のプログラミング作業を自動化する、オープンソースのスケーラブルなプログラミング・インテリジェンス

一般的な紹介 GooseはBlock社によって開発されたオープンソースのAIエージェントツールで、開発者が日常的な開発作業を自動化できるように設計されています。さまざまな大規模言語モデル(LLM)をサポートし、コマンドラインやデスクトップアプリケーションのインターフェースを介してユーザーと対話します。
6ヶ月前
01.4K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: 複数のデータベースと言語モデルをサポートする効率的な検索補強生成(RAG)ツール。

概要 RAGLiteは、PostgreSQLまたはSQLiteデータベースをサポートするRAG(Retrieval Augmented Generation)用のPythonツールキットです。異なる言語モデルやリフォーマラを選択できる柔軟な設定オプションを提供します。
8ヶ月前
01.4K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCPサーバーChatSum: ClaudeでWeChatメッセージをクエリーし要約するためにMCPに頼る

一般的な紹介 MCPサーバー ChatSumは、ユーザーがチャットメッセージを照会し要約するために設計されたオープンソースプロジェクトです。このプロジェクトはGitHubでホストされており、ユーザーが特定のパラメータに基づいてチャットログを照会し、対応する要約を生成することができる強力なツールセットを提供します...
5ヶ月前
01.4K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: ドキュメント/マルチメディアからあらゆる非構造化データを抽出し、構造化データにパースします。

综合介绍 OmniParse是一个强大的数据解析与优化平台,旨在将任何非结构化数据转换为结构化、可操作的数据,优化后适用于GenAI(生成式人工智能)框架。无论是处理文档、表格、图像、视频、音频文件还...
9ヶ月前
01.4K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: Ollamaバックエンドにネイティブに統合されたエンドポイントベースのミニマルなAIチャットツール

综合介绍 Charla 是一个基于终端的聊天应用程序,旨在与本地语言模型进行对话。该应用程序集成了 Ollama 后端,支持上下文感知的对话,并将聊天会话保存为 Markdown 文件。用户可以通过简...
6ヶ月前
01.4K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: Ollamaのネイティブ・モデルと対話するためのクリーンなチャット・インターフェース

综合介绍 HiOllama是一个基于Python和Gradio构建的用户友好界面,旨在与Ollama模型进行交互。它提供了简单直观的网页界面,支持实时文本生成和模型管理功能。用户可以调整参数如温度和最...
9ヶ月前
01.4K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)

Tifa-DeepsexV2-7b-MGRPO: ロールプレイと複雑なダイアログをサポートし、32bを超えるパフォーマンスを持つモデル (ワンクリックインストールパッケージ付き)

総合紹介 Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4は、複雑なロールプレイングや複数ラウンドの対話をサポートするために設計された効率的な言語モデルです。Qwen 2.5-7Bをベースに深く最適化されており、優れたテキスト生成とダイアログ...
5ヶ月前
01.4K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream:画像手がかり語のバッチバックプロパゲーションのためのオープンソースの軽量視覚言語モデル

包括的な紹介 Moondreamは、ディープラーニングとコンピュータビジョン技術による画像記述機能を実現するために設計された、オープンソースの軽量視覚言語モデルです。このモデルは、様々なプラットフォーム上で効率的に実行することができ、特にエッジデバイスに適しています。
7ヶ月前
01.4K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent:マルチモーダルインテリジェンスによるスマートフォンの自動操作

综合介绍 AppAgent 是一个基于大语言模型(LLM)的多模态代理框架,旨在操作智能手机应用程序。该框架通过简化的操作空间,模仿人类的交互方式,如点击和滑动,从而无需系统后端访问,扩大了其在不同应...
7ヶ月前
01.4K
AI蜂巢:基于 Java 的多功能 AI聊天集成平台

AI Hive: Javaベースの汎用AIチャット統合プラットフォーム

包括的な紹介 AIビーハイブ(ai-beehive)は、Spring Boot 3とJDK 17を備えたJava言語上に構築された多機能AIプラットフォームである。このプロジェクトは、ChatGPT...を含む複数のAI技術を統合しています。
9ヶ月前
01.4K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: ドキュメントを構造化データに抽出・分類し、ドキュメント処理プロセスを最適化します。

综合介绍 ExtractThinker 是一个灵活的文档智能工具,利用大型语言模型(LLMs)从文档中提取和分类结构化数据,提供类似 ORM 的无缝文档处理工作流。它支持多种文档加载器,包括 Tess...
7ヶ月前
01.4K
StickerBaker:用AI制作个性贴纸图片

ステッカーベイカー:AIでパーソナライズされたステッカー画像を作る

概要 stickerbakerは、人工知能技術を使って様々な面白いステッカーを作成するオープンソースのステッカーメーカーです。シンプルな猫のステッカーが欲しい人も、多様なステッカーをシリーズで作りたい人も、stickerbakerはあなたのニーズに応えます...
10ヶ月前
01.4K