AI开源项目 - 第27页

順番に並べる

ポスト更新目を通すクドス

フィッシュ・スピーチ：少ないサンプル数で中国語と英語の音声を高速かつ高精度にクローニング

概要フィッシュ・スピーチはフィッシュ・オーディオが開発したオープンソースの音声合成ツールです。このツールはVQ-GAN、Llama、VITSなどの最先端のAI技術に基づいており、テキストをリアルな音声に変換することができます。

4ヶ月前

01.5K

IMS Toucan: 高速でコントロール可能な多言語（7000以上の言語に対応）音声合成ツール

综合介绍 IMS Toucan 是由德国斯图加特大学自然语言处理研究所（IMS）开发的一个先进的文本转语音（TTS）工具包。该工具包支持超过7000种语言，具有快速、可控且计算资源需求低的特点。IMS...

4ヶ月前

0725

ChatTTS：実際の人の話し声を模倣した音声生成モデル（ChatTTSワンクリックアクセラレーションパッケージ）

一般的な紹介 ChatTTSは対話シナリオ用に設計された生成音声モデルです。自然で表現力豊かな音声を生成し、多言語、複数話者をサポートし、対話型ダイアログに適しています。このモデルは、笑い、ポーズ、間投詞のようなきめ細かなリズムの特徴を予測し、制御することで、対話に適した音声を生成します。

4ヶ月前

01.5K

zChunk: Llama-70Bに基づく一般的な意味的チャンキング戦略

包括的な紹介 zChunkは、ZeroEntropyによって開発された、一般的なセマンティック・チャンキングのソリューションを提供する新しいチャンキング戦略です。このストラテジーはLlama-70Bモデルに基づいており、チャンクの生成を促すことでドキュメントのチャンキングプロセスを最適化し、情報検索を高いレベルで維持することを保証します。

4ヶ月前

0663

Chonkie: 軽量なRAGテキストチャンキングライブラリ

综合介绍 Chonkie 是一个轻量级且高效的 RAG（Retrieval-Augmented Generation）文本切块库，旨在帮助开发者快速、简便地对文本进行分块处理。该库支持多种分块方法，包...

4ヶ月前

01.4K

Qwen4Mac: MacのメニューバーにあるQwenの大きなモデルを使って、いつでも会話ができます！

综合介绍 Qwen4Mac是一个开源项目，旨在将Qwen大语言模型（LLM）集成到Mac的菜单栏中，方便用户随时调用和使用。该项目由andreaturchet开发和维护，提供了一种简便的方式，让用户能...

最新のAIツール # AI Java オープンソースプロジェクト

4ヶ月前

0682

口袋AI：手机中运行的离线AI助手，适配 DeepSeek-R1 (5.37GB)

Pocket AI：DeepSeek-R1 (5.37GB)に対応した、携帯電話で動作するオフラインのAIアシスタント。

ポケットAI（PocketPal AI中国語版）は、いつでもどこでもAIと会話できるように設計された強力なオフラインAIアシスタントです。スモール・ランゲージ・モデル（SLM）をベースにしており、インターネット接続のない携帯電話で動作し、特に中国のユーザー体験に適応しています。口...

4ヶ月前

0979

ココロWebGPU: ブラウザのオフライン操作のための音声合成サービス

综合介绍 Kokoro WebGPU是Kokoro文本转语音（TTS）模型的WebGPU版本，由WebML Community在Hugging Face平台上提供。该项目利用WebGPU技术，使用户能...

4ヶ月前

0974

Unsloth: 大規模言語モデルの効率的な微調整と学習のためのオープンソースツール

包括的な紹介 Unslothは、大規模言語モデル（LLM）の微調整と学習のための効率的なツールを提供するために設計されたオープンソースプロジェクトです。このプロジェクトは、Llama、Mistral、Phi、Gemmaなどの有名なモデルをサポートしています。

4ヶ月前

01.1K

ビデオアナライザー：ビデオコンテンツを分析し、詳細な説明を生成します。

Comprehensive Introduction Video Analyzerは、コンピュータ・ビジョン、音声転写、自然言語処理技術を組み合わせて、詳細なビデオ・コンテンツの説明を生成する、総合的なビデオ分析ツールです。このツールは、動画から主要なフレームを抽出し、音声コンテンツを書き起こします。

4ヶ月前

01.4K

CogVLM2: 映像理解と複数回の対話を支援するオープンソースのマルチモーダルモデル

包括的な紹介 CogVLM2は清華大学データマイニング研究グループ（THUDM）によって開発されたオープンソースのマルチモーダルモデルで、Llama3-8Bアーキテクチャをベースとしており、GPT-4Vに匹敵するか、それ以上の性能を提供することを目指している。このモデルは画像理解、多ラウンド対話、視覚...

4ヶ月前

0784

OpenHealthForAll：个人健康数据管理AI助手，上传检查报告定制健康计划

OpenHealthForAll：個人の健康データ管理のためのAIアシスタント、カスタマイズされた健康計画のための検査レポートのアップロード

概論 OpenHealthForAllは、ユーザーの個人的な健康データの管理と理解を支援するために設計されたオープンソースプロジェクトである。人工知能技術を活用することで、OpenHealthForAllはローカルで動作する健康アシスタントを提供し、ユーザーがより良く管理できるようにします。

4ヶ月前

0829

オープンパイロット：オープンソースの自律走行システム。

综合介绍 OpenPilot 是由 comma.ai 开发的开源自动驾驶系统，旨在通过先进的驾驶辅助功能提升现有车辆的驾驶体验和安全性。自 2016 年首次发布以来，OpenPilot 已支持超过 2...

最新のAIツール # AI Java オープンソースプロジェクト

4ヶ月前

0928

OpenAOE: 大規模モデルグループチャットフレームワーク: 複数の大規模言語モデルと同時にチャットする

包括的な紹介 OpenAOEは、オープンソースの大規模モデルグループチャットフレームワークです。OpenAOEを使えば、ユーザーは複数の大規模言語モデル（LLM）と同時に会話し、並列出力を得ることができます。このフレームワークは...

4ヶ月前

0695

Agentic Security：开源的LLM漏洞扫描工具，提供全面的模糊测试和攻击技术

Agentic Security: オープンソースのLLM脆弱性スキャンツール。

综合介绍 Agentic Security是一个开源的LLM（大语言模型）漏洞扫描工具，旨在为开发者和安全专家提供全面的模糊测试和攻击技术。该工具支持自定义规则集或基于代理的攻击，能够集成LLM AP...

4ヶ月前

0710

健康アドバイスを提供するミニ・アシスタントのRAGベースの構築（パイロット・プロジェクト）

概論 LLM-RAG-Longevity-Coachは、Large Language Modelling (LLM)とRetrieval Augmented Generation (RAG)の技術に基づいたチャットボットで、ユーザーにパーソナライズされた健康と長寿のアドバイスを提供するように設計されている。このプロジェクトは、タイラー・バーレ...

4ヶ月前

0829