Entlarvung der großen Modell-Illusion: HHEM-Rankings geben Aufschluss über den Stand der faktischen Konsistenz im LLM-Studium大型语言模型(LLM)的能力日新月异,但其输出内容中出现事实性错误或与原文无关信息的“幻觉”现象,始终是阻碍其更广泛应用和深度信任的一大难题。为了量化评估这一问题,Hughes Hallucinati...AI-Nachrichtenvor 3 Monaten06040
Interview mit Satya Nadella: Wirtschaftswachstum hat Vorrang vor AGI, Microsofts KI-Konzept und der Sprung zum Quantencomputer近日,微软 CEO 萨提亚·纳德拉 (Satya Nadella) 接受了 Dwarkesh Patel 的播客采访,深入探讨了微软在 人工智能 (AI) 和量子计算领域的最新突破,以及他对行业未来发...AI-Nachrichtenvor 4 Monaten06040
Bing: Wie KI-gesteuerte Suchmaschinen den Wert von absichtsgesteuerten SEOs erhöhen können设想一家科技公司计划推出一款创新型环保智能咖啡机。这款咖啡机专为精通技术的咖啡爱好者和追求便捷、个性化以及可持续性的忙碌专业人士设计。为了吸引理想的目标受众,他们聘请了一家营销机构。然而,这家机构未能...AI-Nachrichtenvor 4 Monaten06030
Inception Labs veröffentlicht erstes kommerziell nutzbares Diffusionsmodell für große SprachenInception Labs 推出 Mercury 系列扩散大语言模型 (dLLM),其速度和成本比现有 LLM 降低了 10 倍,将语言模型的智能和速度推向了新的前沿。 核心要点 Inception...AI-Nachrichtenvor 3 Monaten06010
Runway bringt Gen-4 auf den Markt: Eine neue Generation von KI-Videogenerationsmodellen mit dem Schwerpunkt auf Weltkonsistenz und Kontrollierbarkeit人工智能研究公司 Runway 近日发布了其下一代媒体生成 AI 模型系列—— Runway Gen-4。该模型旨在解决当前 AI 视频生成中普遍存在的一致性难题,并提升内容生成的可控性,标志着向更稳...AI-Nachrichtenvor 2 Monaten05980
DeepSeek-V3/R1 Überblick über Reasoning-Systeme (DeepSeek Open Source Woche Tag 6)系统设计原则 DeepSeek-V3/R1 推理服务的优化目标是:更高的吞吐量和更低的延迟。 为了优化这两个目标,DeepSeek 采用的解决方案是跨节点专家并行 (EP)。 首先,EP 显著扩大了批...AI-Nachrichtenvor 3 Monaten05960
Grok 3 Benchmark-Daten 'verwässert'? OpenAI-Mitarbeiter sagt, xAI könnte die Leistung falsch darstellen关于 AI 基准测试以及 AI 实验室如何公布测试结果的争论正日益公开化。长期以来,AI 性能的衡量标准和报告方式就充满了争议,如今,这些幕后争论终于走到了聚光灯下。 本周,一位 OpenAI 员工 ...AI-Nachrichtenvor 4 Monaten05960
Microsoft Magma Model: Ein intelligenter KI-Körper, der sich um UI-Operationen und Robotersteuerungen kümmert最近,微软研究院发布了一项重磅研究成果——多模态人工智能代理基础模型 Magma。 这款模型可谓是身兼多项绝技,它不仅能像人一样“看懂”图像和“听懂”语言,还能直接上手操作用户界面 (UI) 和控制机...AI-Nachrichtenvor 4 Monaten05930
Baidu ist zur Vernunft gekommen, und die Wenshin Intelligent Body Platform wird vollen Zugang zu DeepSeek haben!百度官方消息:为服务广大开发者朋友们调用各类模型能力创建和调优智能体,文心智能体平台将全面接入DeepSeek。 截至2025年2月16日21年,还未在文心智能体平台看到 DeepSeek ,估计正抓...AI-Nachrichtenvor 4 Monaten05930
AI Website Gebäude Dark Horse Lovable: 0 bis $ 17M ARR in drei Monaten瑞典初创公司 Lovable 近期的增长轨迹引人注目,展示了 AI 应用在特定市场定位下的潜力。该公司由 Anton Osika 和 Fabian Hedin 在 2023 年创立,最初通过一个名为 ...AI-Nachrichtenvor 3 Monaten05920
Seit GPT2 plant OpenAI die Veröffentlichung neuer Open-Source-Gewichtungsmodelle4月1日, OpenAI 首席执行官 Sam Altman 通过社交媒体宣布,公司计划在未来数月内发布一款具备强大推理能力的新型“开源权重”(open-weight)语言模型。OpenAI 对此表示期...AI-Nachrichtenvor 2 Monaten05910
Die iOS-Version der App von Google unterstützt Gemini nicht mehr, die Nutzer müssen eine eigenständige App herunterladen.苹果手机上的 Google App 不再自带 Gemini 功能了,想用 Gemini 的朋友们,得单独下载一个 App 才行。 最近,Google 公司宣布,他们把 iOS 版本 Google ...AI-Nachrichtenvor 4 Monaten05900
o3 Praktische Demonstration der Überlegenheit von generischen Inferenzmodellen gegenüber spezialisierten Programmiermodellen im Bereich der Programmierung原文:基于大推理模型的编程竞赛能力研究,以下为简要总结,方便阅读。 1. 引言 1.1 背景与动机 近年来,大型语言模型(LLMs)在程序生成和复杂推理任务中取得了显著进展。编程竞赛,尤其是像国际...AI-Nachrichtenvor 4 Monaten05830
WikiTok: Wenn Wikipedia sich die Haut von "Shakeology" überzieht - einem unausgereiften Produkt mit einer leeren Idee - kann es sich dann auf KI verlassen, um sein Schicksal zu ändern?在这个信息爆炸的时代,短视频平台如同一个巨大的“时间黑洞”,吞噬着人们大量的碎片时间。为了对抗这种数字沉迷,各种屏幕健康管理工具和数字极简生活方式应运而生,但效果往往差强人意。最近,一款名为 Wiki...AI-Nachrichtenvor 4 Monaten05760
AI Analytics Report: 15 Qualitätskategorien, die 2025 für TikTok in Übersee zu beachten sind在本报告中,我们为您呈现了评选出的2025年亚马逊产品红利市场的前15名,适合在TikTok进行售卖。我们在分析了推动成功的关键市场因素后选择了这些机会: 高需求 – 产品持续产生高关键词搜索量。 强...AI-Nachrichtenvor 4 Monaten05700
Cloudflare startet AI Maze: Bösartige Crawler mit generativer KI bekämpfen人工智能生成内容正以前所未有的速度增长,据报道,去年秋季 Facebook 上最受欢迎的 20 个帖子中,有 4 个是由 AI 生成。此外,Medium 估计其平台上 47% 的内容也来自 AI。如同...AI-Nachrichtenvor 3 Monaten05690
Ein tiefer Einblick in die nächste Generation von KI-Programmierwerkzeugen und innovative Praktiken mit AutoDev Sketch人工智能 (AI) 技术正以前所未有的速度渗透到软件开发的各个环节,其中 AI 编程工具的演进尤为引人注目。本文将深入剖析新一代 AI 编程工具的发展趋势,并结合 AutoDev Sketch 的实践...AI-Nachrichtenvor 4 Monaten05650
Mistral Small 3.1 vs. Gemma 3: Kann der 24-Milliarden-Parameter 27 Milliarden herausfordern?轻量级大模型正成为 AI 领域的新战场。 继 Google DeepMind 推出 Gemma 3 后,Mistral AI 于 2024 年 3 月发布了 Mistral Small 3.1。这款拥...AI-Nachrichtenvor 3 Monaten05630
Gemini API führt neues Modell zur Texteinbettung ein: Leistungsspitzen, 8K-Eingabeunterstützung近日,Google 在 Gemini API 中推出了一款全新的实验性文本嵌入模型 gemini-embedding-exp-03-07[1]。该模型基于 Gemini 模型训练,继承了 Gemini...AI-Nachrichtenvor 3 Monaten05620