OpenAI发布:大型语言模型如何监控自身的不当行为

OpenAI release: Wie große Sprachmodelle sich selbst auf Fehlverhalten überwachen

Large Reasoning Models (LLMs) nutzen Schwachstellen aus, wenn sie die Gelegenheit dazu haben. Forschungsergebnisse deuten darauf hin, dass diese Schwachstellen aufgedeckt werden können, indem große Sprachmodelle (LLMs) zur Überwachung ihrer Gedankenketten (CoT) eingesetzt werden. Die Bestrafung von Modellen für "schlechte Gedanken" verhindert die meisten Fehlverhaltensweisen nicht...
vor 3 Monaten
04780
DeepSearch/DeepResearch中最优文本段选择和URL重排

Optimale Textsegmentauswahl und URL-Umordnung in DeepSearch/DeepResearch

Wenn Sie den letzten klassischen Artikel von Jina, "Design und Implementierung von DeepSearch/DeepResearch", gelesen haben, möchten Sie vielleicht tiefer in die Details einsteigen, die die Qualität Ihrer Antworten dramatisch verbessern können. Dieses Mal werden wir uns auf zwei Details konzentrieren: die Extraktion von optimalem Text aus langen Webseiten...
vor 3 Monaten
04460
长文本向量模型在4K Tokens 之外形同盲区?

Langtext-Vektormodelle Blind über 4K Token hinaus?

NoLiMA, veröffentlicht im Februar 2025, ist ein Large Language Model (LLM) Verfahren zur Bewertung des Verständnisses langer Texte. Im Gegensatz zu herkömmlichen Needle-in-a-Haystack (NIAH)-Tests, die auf dem Abgleich von Schlüsselwörtern beruhen, ist es...
vor 3 Monaten
04430
IDProtector:保护人像照片免受AI生成技术滥用的方法

IDProtector: ein Weg, um Porträts vor dem Missbrauch von KI-Technologie zu schützen

1 Hintergrund und Probleme Mit der rasanten Entwicklung von Technologien der Künstlichen Intelligenz (KI), insbesondere der Weiterentwicklung von Diffusionsmodellen, ist die KI in der Lage, sehr realistische Porträtbilder zu erzeugen. Beispielsweise benötigen Technologien wie InstantID nur ein Foto, um mehrere neue Bilder mit denselben Identifikationsmerkmalen zu erzeugen...
vor 3 Monaten
04310
GTR 框架:基于异构图和分层检索的跨表问答新方法

Der GTR-Rahmen: ein neuer Ansatz für tabellenübergreifende Fragen und Antworten auf der Grundlage heterogener Graphen und hierarchischer Abfragen

1 EINLEITUNG In der heutigen Informationsexplosion wird eine große Menge an Wissen in Form von Tabellen in Webseiten, Wikipedia und relationalen Datenbanken gespeichert. Herkömmliche Frage- und Antwortsysteme haben jedoch oft Schwierigkeiten, komplexe Abfragen über mehrere Tabellen hinweg zu bearbeiten, was zu einer großen Herausforderung im Bereich der künstlichen Intelligenz geworden ist. Um diese Herausforderung zu bewältigen, haben Forscher ...
vor 2 Monaten
04210
基于LLM的查询扩展 (Query Expansion)

LLM-basierte Abfrageerweiterung

Waren Sie schon einmal in einer Situation, in der Sie ein Schlüsselwort in eine Suchmaschine eingegeben haben und die Ergebnisse etwas anderes als das Gewünschte enthielten? Oder Sie möchten nach etwas suchen, wissen aber nicht, mit welchen Worten Sie es am genauesten ausdrücken können? Keine Sorge, die Technologie der "Abfrageerweiterung" kann Ihnen helfen, diese Probleme zu lösen. Kürzlich wurde die Abfrageerweiterung...
vor 3 Monaten
03680
GPT-4.1 官方提示工程指南(中文版)

GPT-4.1 Offizielles Handbuch für technische Tipps (chinesische Version)

Die GPT-4.1-Modellfamilie bietet im Vergleich zu GPT-4o erhebliche Verbesserungen bei der Codierung, der Einhaltung von Anweisungen und der Verarbeitung von langem Kontext. Insbesondere ist die Leistung bei der Codegenerierung und bei Reparaturaufgaben besser, das Verständnis und die Ausführung komplexer Anweisungen sind genauer, und längere Eingabetexte können effizient verarbeitet werden.
vor 2 Monaten
03600
九大主流大模型安全框架深度剖析与对比

Eingehende Analyse und Vergleich von neun Mainstream Big Model Security Frameworks

Mit der raschen Entwicklung und breiten Anwendung von Technologien zur Sprachmodellierung in großem Maßstab rücken deren potenzielle Sicherheitsrisiken zunehmend in den Mittelpunkt des Interesses der Branche. Um diesen Herausforderungen zu begegnen, haben viele der weltweit führenden Technologieunternehmen, Standardisierungsorganisationen und Forschungsinstitute eigene Sicherheitsrahmenwerke entwickelt und veröffentlicht. In diesem Papier werden neun dieser ...
vor 1 Monat
03070