DragAnything:对图像中实体对象控制运动硅基生成视频

DragAnything: 画像内の固形オブジェクトのためのシリコンベースのビデオ生成モーションの制御

概要 DragAnythingは、エンティティ表現によって任意のオブジェクトのモーションコントロールを実現することを目的としたオープンソースプロジェクトです。このプロジェクトはShowlabチームによって開発され、ECCV 2024に採択されました。DragAnythingは、オブジェクトの動きを表現するための方法を提供します。
4ヶ月前
0685
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio:マルチモーダル音声インタラクションフレームワーク。

包括的な紹介 Step-Audioはオープンソースのインテリジェント音声対話フレームワークであり、制作環境において、すぐに使える音声理解と音声生成機能を提供するように設計されています。このフレームワークは、多言語会話(例:中国語、英語、日本語)、感情音声(例:嬉しい、悲しい)、地域方言(例:広東語、四川語、中国語、英語、日本語)をサポートしています。
4ヶ月前
0942
心流AI助手:深度知识搜索工具,集成知识库的专业知识研究助手

マインドストリームAIアシスタント:深い知識検索ツール、統合された知識ベースを持つ専門知識研究アシスタント

综合介绍 心流AI助手是一款智能搜索和知识获取工具,旨在帮助用户高效获取各种知识,无论是日常生活百科还是专业学术论文。通过心流AI助手,用户可以轻松搜索全网内容,快速找到所需信息,并进入高效的心流状态...
4ヶ月前
0752
Doctranslate.io:基于AI的全能翻译工具,支持文本、音频、图像和视频翻译

Doctranslate.io:テキスト、音声、画像、動画翻訳をサポートするAIベースのオールインワン翻訳ツール

概要 Doctranslate.ioは、多言語での文書翻訳をサポートするオンライン文書翻訳プラットフォームです。ユーザーは、.docx、.pptx、.pdfなどの様々な形式の文書をアップロードすることができ、プラットフォームは、迅速かつ正確に必要な言語に文書を翻訳します。
4ヶ月前
0620
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp:カスタム面接質問を生成し、インテリジェントな分析を実行するオープンソースAI音声面接プラットフォーム

综合介绍 FoloUp 是一个开源平台,专为企业提供AI驱动的语音面试解决方案。通过FoloUp,企业可以快速生成针对职位描述的定制化面试问题,并通过AI进行自然对话式的面试。平台还提供详细的面试分析...
3ヶ月前
0734
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: ネイティブLLM駆動のVimプログラミングアシスタント。

概要 VimLMは、ネイティブのLLM(Large Language Model)によって駆動されるコードアシスタントを提供するVimプラグインです。Vim コマンドを通してネイティブの LLM モデルと対話することで、コードのコンテキストを自動的に取得し、Vim でのコード編集を支援します。
4ヶ月前
0716
免费在线数字人生成工具,支持声音、数字分身克隆和视频去水印

音声、デジタル分割クローン、ビデオ透かし除去をサポートする無料オンラインデジタルパーソン生成ツール

综合介绍 数字人生成系统是一个提供免费数字人生成服务的网站。该网站支持声音克隆、声音复刻、数字人形象模板、数字分身克隆、视频去水印等功能,旨在为用户提供高效、便捷的数字人生成解决方案。用户可以通过上传...
7日前
0804
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量

信頼できるAI:自動化された大規模言語モデル評価のためのフレームワーク。

包括的な紹介 DeepEvalは、大規模な言語モデリングシステムを評価およびテストするための、使いやすいオープンソースのLLM評価フレームワークです。Pytestに似ていますが、LLM出力のユニットテストに重点を置いています。DeepEvalは、G-Eval、ファントム...
4ヶ月前
0728
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: AI対話とコード実行を統合したオンラインデータ分析フォーム

概要 Quadraticは、AI、コード、データ接続機能を組み合わせたオープンソースのスマート・スプレッドシート・ツールで、強力なデータ処理と分析機能をユーザーに提供するように設計されています。Python、SQL、Rustなどのプログラミング言語をサポートすることで、Quadratic...
4ヶ月前
0607
Azure TTS Importer:将语音合成服务集成到阅读软件中

Azure TTS Importer:音声合成サービスを読み上げソフトウェアに統合する

包括的な紹介 TTS Importerは、Azure TTS(Text-to-Speech)音声合成サービスを様々な読み上げソフトに簡単にインポートできるように設計されたオープンソースプロジェクトです。このツールは、Read(legado...)を含むいくつかの一般的な読み上げソフトウェアをサポートしています。
4ヶ月前
0627
debdeb.io:根据输入话题AI就两方观点辩论,学习双方辩论技巧

debdeb.io:入力されたトピックに基づいてAIが賛否両論を討論。

一般的な紹介 debdeb.ioは、高速でインタラクティブなAIディベートを提供することに重点を置いたプラットフォームです。ユーザーが様々なトピックに関するディベートを生成し、参加することを可能にし、ディベートの質と楽しさを高めるためにAI技術を活用しています。このプラットフォームは、ユーザーが軽...
4ヶ月前
0614
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: SadTalker、ポートレートビデオを使ってデジタル人物を生成する機能を強化

概要 SadTalker-Video-Lip-Syncは、SadTalkersの実装に基づいたビデオリップ合成ツールです。このプロジェクトは、音声駆動型生成によって唇の形状を生成し、設定可能な顔領域拡張を使用して、生成された唇の形状の鮮明度を向上させます...
4ヶ月前
0717
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)

Tifa-DeepsexV2-7b-MGRPO: ロールプレイと複雑なダイアログをサポートし、32bを超えるパフォーマンスを持つモデル (ワンクリックインストールパッケージ付き)

総合紹介 Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4は、複雑なロールプレイングや複数ラウンドの対話をサポートするために設計された効率的な言語モデルです。Qwen 2.5-7Bをベースに深く最適化されており、優れたテキスト生成とダイアログ...
4ヶ月前
01.1K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: macOSデバイスのデスクトップ操作を自動化するAIインテリジェンス

概論 mac assistantはmacOSのために設計されたAI知能体プロジェクトであり、ネイティブソフトウェアとウェブ機能を組み合わせることでユーザー操作を簡素化することを目的としている。このプロジェクトは現在OpenAIとGEMINIのAPIをサポートしており、将来的には...
4ヶ月前
0655