フィッシュ・スピーチ:少ないサンプル数で中国語と英語の音声を高速かつ高精度にクローニング概要 フィッシュ・スピーチはフィッシュ・オーディオが開発したオープンソースの音声合成ツールです。このツールはVQ-GAN、Llama、VITSなどの最先端のAI技術に基づいており、テキストをリアルな音声に変換することができます。最新のAIツール# AI Java オープンソースプロジェクト# AIボイスクローニング4ヶ月前01.5K
IMS Toucan: 高速でコントロール可能な多言語(7000以上の言語に対応)音声合成ツール综合介绍 IMS Toucan 是由德国斯图加特大学自然语言处理研究所(IMS)开发的一个先进的文本转语音(TTS)工具包。该工具包支持超过7000种语言,具有快速、可控且计算资源需求低的特点。IMS...最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成4ヶ月前0725
ChatTTS:実際の人の話し声を模倣した音声生成モデル(ChatTTSワンクリックアクセラレーションパッケージ)一般的な紹介 ChatTTSは対話シナリオ用に設計された生成音声モデルです。自然で表現力豊かな音声を生成し、多言語、複数話者をサポートし、対話型ダイアログに適しています。このモデルは、笑い、ポーズ、間投詞のようなきめ細かなリズムの特徴を予測し、制御することで、対話に適した音声を生成します。最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成4ヶ月前01.5K
zChunk: Llama-70Bに基づく一般的な意味的チャンキング戦略包括的な紹介 zChunkは、ZeroEntropyによって開発された、一般的なセマンティック・チャンキングのソリューションを提供する新しいチャンキング戦略です。このストラテジーはLlama-70Bモデルに基づいており、チャンクの生成を促すことでドキュメントのチャンキングプロセスを最適化し、情報検索を高いレベルで維持することを保証します。最新のAIツール# AI Java オープンソースプロジェクト# ドキュメントの抽出とクリーニング4ヶ月前0663
Chonkie: 軽量なRAGテキストチャンキングライブラリ综合介绍 Chonkie 是一个轻量级且高效的 RAG(Retrieval-Augmented Generation)文本切块库,旨在帮助开发者快速、简便地对文本进行分块处理。该库支持多种分块方法,包...最新のAIツール# AI Java オープンソースプロジェクト# ドキュメントの抽出とクリーニング4ヶ月前01.4K
Qwen4Mac: MacのメニューバーにあるQwenの大きなモデルを使って、いつでも会話ができます!综合介绍 Qwen4Mac是一个开源项目,旨在将Qwen大语言模型(LLM)集成到Mac的菜单栏中,方便用户随时调用和使用。该项目由andreaturchet开发和维护,提供了一种简便的方式,让用户能...最新のAIツール# AI Java オープンソースプロジェクト4ヶ月前0682
Pocket AI:DeepSeek-R1 (5.37GB)に対応した、携帯電話で動作するオフラインのAIアシスタント。ポケットAI(PocketPal AI中国語版)は、いつでもどこでもAIと会話できるように設計された強力なオフラインAIアシスタントです。スモール・ランゲージ・モデル(SLM)をベースにしており、インターネット接続のない携帯電話で動作し、特に中国のユーザー体験に適応しています。口...最新のAIツール# AI Java オープンソースプロジェクト# AIローカライズチャットアプリケーション4ヶ月前0979
ココロWebGPU: ブラウザのオフライン操作のための音声合成サービス综合介绍 Kokoro WebGPU是Kokoro文本转语音(TTS)模型的WebGPU版本,由WebML Community在Hugging Face平台上提供。该项目利用WebGPU技术,使用户能...最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成4ヶ月前0974
Unsloth: 大規模言語モデルの効率的な微調整と学習のためのオープンソースツール包括的な紹介 Unslothは、大規模言語モデル(LLM)の微調整と学習のための効率的なツールを提供するために設計されたオープンソースプロジェクトです。このプロジェクトは、Llama、Mistral、Phi、Gemmaなどの有名なモデルをサポートしています。最新のAIツール# AI Java オープンソースプロジェクト# 大型モデルの微調整4ヶ月前01.1K
ビデオアナライザー:ビデオコンテンツを分析し、詳細な説明を生成します。Comprehensive Introduction Video Analyzerは、コンピュータ・ビジョン、音声転写、自然言語処理技術を組み合わせて、詳細なビデオ・コンテンツの説明を生成する、総合的なビデオ分析ツールです。このツールは、動画から主要なフレームを抽出し、音声コンテンツを書き起こします。最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出4ヶ月前01.4K
CogVLM2: 映像理解と複数回の対話を支援するオープンソースのマルチモーダルモデル包括的な紹介 CogVLM2は清華大学データマイニング研究グループ(THUDM)によって開発されたオープンソースのマルチモーダルモデルで、Llama3-8Bアーキテクチャをベースとしており、GPT-4Vに匹敵するか、それ以上の性能を提供することを目指している。このモデルは画像理解、多ラウンド対話、視覚...最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出4ヶ月前0784
OpenHealthForAll:個人の健康データ管理のためのAIアシスタント、カスタマイズされた健康計画のための検査レポートのアップロード概論 OpenHealthForAllは、ユーザーの個人的な健康データの管理と理解を支援するために設計されたオープンソースプロジェクトである。人工知能技術を活用することで、OpenHealthForAllはローカルで動作する健康アシスタントを提供し、ユーザーがより良く管理できるようにします。最新のAIツール# AI Java オープンソースプロジェクト# AI生活効率化アシスタント4ヶ月前0829
オープンパイロット:オープンソースの自律走行システム。综合介绍 OpenPilot 是由 comma.ai 开发的开源自动驾驶系统,旨在通过先进的驾驶辅助功能提升现有车辆的驾驶体验和安全性。自 2016 年首次发布以来,OpenPilot 已支持超过 2...最新のAIツール# AI Java オープンソースプロジェクト4ヶ月前0928
OpenAOE: 大規模モデルグループチャットフレームワーク: 複数の大規模言語モデルと同時にチャットする包括的な紹介 OpenAOEは、オープンソースの大規模モデルグループチャットフレームワークです。OpenAOEを使えば、ユーザーは複数の大規模言語モデル(LLM)と同時に会話し、並列出力を得ることができます。このフレームワークは...最新のAIツール# AI Java オープンソースプロジェクト# AI統合マルチモデル対話プラットフォーム4ヶ月前0695
Agentic Security: オープンソースのLLM脆弱性スキャンツール。综合介绍 Agentic Security是一个开源的LLM(大语言模型)漏洞扫描工具,旨在为开发者和安全专家提供全面的模糊测试和攻击技术。该工具支持自定义规则集或基于代理的攻击,能够集成LLM AP...最新のAIツール# AI Java オープンソースプロジェクト#プロンプト脱獄4ヶ月前0710
健康アドバイスを提供するミニ・アシスタントのRAGベースの構築(パイロット・プロジェクト)概論 LLM-RAG-Longevity-Coachは、Large Language Modelling (LLM)とRetrieval Augmented Generation (RAG)の技術に基づいたチャットボットで、ユーザーにパーソナライズされた健康と長寿のアドバイスを提供するように設計されている。このプロジェクトは、タイラー・バーレ...最新のAIツール# AI Java オープンソースプロジェクト# AI生活効率化アシスタント4ヶ月前0829
Maestro:主流のオープンソース視覚言語のモデルの微調整プロセスを簡素化するツール包括的な紹介 MaestroはRoboflowによって開発されたツールで、マルチモーダルモデルのファインチューニングプロセスを簡素化、高速化し、誰でも独自の視覚マクロモデルをトレーニングできるようにします。F... などの一般的な視覚言語モデル(VLM)を微調整するためのレシピが用意されています。最新のAIツール# AI Java オープンソースプロジェクト# 大型モデルの微調整4ヶ月前0881
ワン・プロンプト・ワンストーリー:テキスト・プロンプトがキャラクターのアイデンティティと一貫したイメージを生み出す综合介绍 One-Prompt-One-Story (1Prompt1Story) 是一个创新的文本到图像生成工具,旨在通过单一提示实现一致性图像生成。该项目由刘涛等人在ICLR 2025会议上提出...最新のAIツール# AIイメージスタイルコントロール# AI Java オープンソースプロジェクト4ヶ月前0874
Next.jsアプリケーションにRAG駆動型オンラインチャットツールを追加する综合介绍 Upstash RAG Chat Component是一个专为Next.js应用程序设计的React组件,旨在提供基于RAG(检索增强生成)技术的AI聊天界面。该组件结合了Upstash V...最新のAIツール# AI Java オープンソースプロジェクト4ヶ月前0788