ビッグモデル幻想の解明:HHEMランキングは、LLMにおける事実の一貫性の現状に洞察を与える大型语言模型(LLM)的能力日新月异,但其输出内容中出现事实性错误或与原文无关信息的“幻觉”现象,始终是阻碍其更广泛应用和深度信任的一大难题。为了量化评估这一问题,Hughes Hallucinati...AIニュース3ヶ月前06040
サティア・ナデラへのインタビュー:AGIよりも経済成長を優先、マイクロソフトのAI青写真と量子コンピューティングへの飛躍近日,微软 CEO 萨提亚·纳德拉 (Satya Nadella) 接受了 Dwarkesh Patel 的播客采访,深入探讨了微软在 人工智能 (AI) 和量子计算领域的最新突破,以及他对行业未来发...AIニュース4ヶ月前06040
ビング:AIを搭載した検索エンジンは、いかにしてインテント主導型SEOの価値を高めることができるか?あるハイテク企業が、革新的で環境に優しいスマート・コーヒー・メーカーの発売を計画しているとしよう。このコーヒーメーカーは、テクノロジーに精通したコーヒー愛好家や、利便性、パーソナライズ、持続可能性を求める多忙なプロフェッショナル向けに設計されている。希望するターゲット層を惹きつけるために、彼らはマーケティングエージェンシーを雇った。しかし、その代理店は失敗した。AIニュース4ヶ月前06030
インセプション・ラボ、初の商用グレード拡散ビッグ・ランゲージ・モデルをリリースInception Labs 推出 Mercury 系列扩散大语言模型 (dLLM),其速度和成本比现有 LLM 降低了 10 倍,将语言模型的智能和速度推向了新的前沿。 核心要点 Inception...AIニュース3ヶ月前06010
ランウェイが「Gen-4」を発表:世界の一貫性とコントロール性を重視した新世代のAI映像生成モデル人工智能研究公司 Runway 近日发布了其下一代媒体生成 AI 模型系列—— Runway Gen-4。该模型旨在解决当前 AI 视频生成中普遍存在的一致性难题,并提升内容生成的可控性,标志着向更稳...AIニュース2ヶ月前05980
DeepSeek-V3/R1 推論システムの概要 (DeepSeek Open Source Week 6日目)系统设计原则 DeepSeek-V3/R1 推理服务的优化目标是:更高的吞吐量和更低的延迟。 为了优化这两个目标,DeepSeek 采用的解决方案是跨节点专家并行 (EP)。 首先,EP 显著扩大了批...AIニュース3ヶ月前05960
Grok 3のベンチマークデータは「水増し」? OpenAIの社員が「xAIはパフォーマンスを誤魔化している可能性がある」と発言关于 AI 基准测试以及 AI 实验室如何公布测试结果的争论正日益公开化。长期以来,AI 性能的衡量标准和报告方式就充满了争议,如今,这些幕后争论终于走到了聚光灯下。 本周,一位 OpenAI 员工 ...AIニュース4ヶ月前05960
マイクロソフト マグマモデル:UI操作とロボット制御を担うAIインテリジェントボディ最近,微软研究院发布了一项重磅研究成果——多模态人工智能代理基础模型 Magma。 这款模型可谓是身兼多项绝技,它不仅能像人一样“看懂”图像和“听懂”语言,还能直接上手操作用户界面 (UI) 和控制机...AIニュース4ヶ月前05930
バイドゥは正気を取り戻し、文心智能体プラットフォームはディープシークにフルアクセスできるようになった!百度官方消息:为服务广大开发者朋友们调用各类模型能力创建和调优智能体,文心智能体平台将全面接入DeepSeek。 截至2025年2月16日21年,还未在文心智能体平台看到 DeepSeek ,估计正抓...AIニュース4ヶ月前05930
AIサイト構築のダークホースLovable:3ヶ月でARR0ドルから1700万ドルへスウェーデンの新興企業Lovableの最近の成長軌道は説得力があり、特定の市場ニッチにおけるAIアプリケーションの可能性を示している。アントン・オシカとファビアン・ヘディンによって2023年に設立された同社は、当初は、AIアプリケーションの開発を通じてスタートした。AIニュース3ヶ月前05920
GPT2以降、OpenAIは新しいオープンソースの重み付けモデルをリリースする予定である。4月1日, OpenAI 首席执行官 Sam Altman 通过社交媒体宣布,公司计划在未来数月内发布一款具备强大推理能力的新型“开源权重”(open-weight)语言模型。OpenAI 对此表示期...AIニュース2ヶ月前05910
GoogleのiOS版アプリはGeminiをサポートしていないため、ユーザーはスタンドアロンのアプリをダウンロードする必要がある。苹果手机上的 Google App 不再自带 Gemini 功能了,想用 Gemini 的朋友们,得单独下载一个 App 才行。 最近,Google 公司宣布,他们把 iOS 版本 Google ...AIニュース4ヶ月前05900
o3 プログラミング領域において、特殊なプログラミングモデルよりも汎用推論モデルの方が優れていることの実践的実証原文:基于大推理模型的编程竞赛能力研究,以下为简要总结,方便阅读。 1. 引言 1.1 背景与动机 近年来,大型语言模型(LLMs)在程序生成和复杂推理任务中取得了显著进展。编程竞赛,尤其是像国际...AIニュース4ヶ月前05830
WikiTok:ウィキペディアが "Shakeology "という中途半端なアイデア商品の皮を被ったとき、その運命を変えるためにAIに頼ることができるだろうか?在这个信息爆炸的时代,短视频平台如同一个巨大的“时间黑洞”,吞噬着人们大量的碎片时间。为了对抗这种数字沉迷,各种屏幕健康管理工具和数字极简生活方式应运而生,但效果往往差强人意。最近,一款名为 Wiki...AIニュース4ヶ月前05760
AI分析レポート:2025年、海外のTikTokが注目する15の品質カテゴリー在本报告中,我们为您呈现了评选出的2025年亚马逊产品红利市场的前15名,适合在TikTok进行售卖。我们在分析了推动成功的关键市场因素后选择了这些机会: 高需求 – 产品持续产生高关键词搜索量。 强...AIニュース4ヶ月前05700
クラウドフレアがAI Mazeを発表:生成AIで悪意のあるクローラーに対抗人工知能が生成したコンテンツはかつてないスピードで成長しており、昨年秋にフェイスブックで最も人気のあった投稿20のうち4つがAIによって生成されたと報告されている。さらに、Mediumは、同社のプラットフォーム上のコンテンツの47%もAIによるものだと推定している。AIニュース3ヶ月前05690
AutoDevスケッチで次世代のAIプログラミングツールと革新的なプラクティスを深く掘り下げる人工智能 (AI) 技术正以前所未有的速度渗透到软件开发的各个环节,其中 AI 编程工具的演进尤为引人注目。本文将深入剖析新一代 AI 编程工具的发展趋势,并结合 AutoDev Sketch 的实践...AIニュース4ヶ月前05650
ミストラル・スモール3.1対ジェンマ3:240億のパラメータは270億に挑戦できるか?軽量大型モデルがAIの新たな戦場になりつつある。 グーグル・ディープマインドがジェンマ3を発表したのに続き、ミストラルAIは2024年3月にミストラル・スモール3.1をリリースした。AIニュース3ヶ月前05630
Gemini API、新しいテキスト埋め込みモデルを発表:パフォーマンス急上昇、8K入力サポート近日,Google 在 Gemini API 中推出了一款全新的实验性文本嵌入模型 gemini-embedding-exp-03-07[1]。该模型基于 Gemini 模型训练,继承了 Gemini...AIニュース3ヶ月前05620