Analyse der Produktform von KI bei der Durchführung von Desktop-Manipulationsaufgaben unter Verwendung von AutoGLM als Leitfaden

AI-NachrichtenGeschrieben vor 2 Monaten Sharenet.ai
490 0
Trae

Heute hat Wisdom Spectrum "AutoGLM Contemplation" veröffentlicht, von dem viele sagen, es sei eine Version von Manus Ich denke, es ist richtig, dass Manus als Deep Research Produkt oder als Deep Research Produkt klassifiziert werden kann. Aber eine solch einfache Kategorisierung würde sowohl bei den Entwicklern als auch bei den Nutzern eine Menge kognitiver Fehler hervorrufen, und ich denke, viele Leute haben das gleiche Problem, zumindest ich.

Think Smart Spectrum veröffentlicht bisher eine Reihe von Anwendungen zur Desktop-Automatisierung ( AutoGLM-Web-Plugin ), bis zu den "AutoGLM-Meditationen", können Sie im Grunde eine fast vollständige Aufstellung der gesamten Smart Spectrum-Produktlinie sehen.

Daher dreht sich das heutige Gespräch um "AutoGLM Meditations", das die Branchenfähigkeiten von KI-Produkten dekonstruiert, die betriebliche Desktop-Aufgaben übernehmen.

以AutoGLM为引,分析AI执行桌面操作任务的产品形态

 

Die offizielle Präsentation des Wisdom Spectrum ist pragmatisch

AutoGLM Contemplation ist ein autonomer intelligenter Körper (AI-Agent), der offene Fragen untersuchen und auf der Grundlage der Ergebnisse Aktionen durchführen kann. Er ist in der Lage, menschliche Denkprozesse zu simulieren, von der Datenbeschaffung und -analyse bis zur Berichterstellung.

 

Für den Benutzer ist das, was "AutoGLM-Kontemplation" wirklich ist, das Wort des Entwicklers, und der Entwickler kann dem Benutzer dabei helfen, sich auf einen Funktionspunkt zu konzentrieren und ihn durch ihn hindurch zu führen, aber letztendlich gibt es keine Möglichkeit, ihn im Namen des Benutzers selbst zu definieren.

Für Entwickler ist die Diskussion von "AutoGLM Contemplations" Manus, Deep Research,Weisheitsspektrum Kuh, KI-Suche,Browser-NutzungMan muss seine Funktionen aufschlüsseln und die Grenzen seiner Möglichkeiten diskutieren, damit sich die Diskussion lohnt. Wenn man die AutoGLM-Betrachtung einfach auf folgende Punkte zusammenfasst Manus Es gibt offensichtliche Fehler, wie zum Beispiel, dass Manus in der Lage ist, Rechenaufgaben zu erledigen, "AutoGLM Meditation" aber nicht.

 

Beginnen Sie damit, die grundlegenden Funktionen von AutoGLM Meditation zu verstehen.

verbraucht Clear Words Browser Plugin Für diejenigen unter Ihnen, die festgestellt haben, dass sie sich ähneln, sind sie jetzt unter der Produktlinie "AutoGLM" vereint, und es wird empfohlen, dass Sie mit dem Plug-in beginnen, bevor Sie den "AutoGLM Contemplation"-Client verwenden. Die Funktionalität der beiden ist nicht gleich, und das Plugin ist (derzeit) leistungsfähiger als der Client.

Allerdings kann der Client derzeit auf Websites zugreifen, die nicht auf der Whitelist stehen, während das Plugin derzeit den Umfang der Informationen begrenzt:

以AutoGLM为引,分析AI执行桌面操作任务的产品形态

Daher kann das Potenzial der AutoGLM Contemplation-Funktion besser ausgeschöpft werden, wenn der Client zum Verständnis der Funktion herangezogen wird.

 

1. laden Sie den Client herunter, Sie müssen auch das Plug-in installieren

Herunterladen: https://autoglm-research.zhipuai.cn/#get_started

以AutoGLM为引,分析AI执行桌面操作任务的产品形态

 

2. die erste Aufgabe einleiten (gemeinsam arbeiten und den Prozess beobachten)

从 https://sharenet.ai/ 找到所有免费的“AI翻译”工具,仅收集有客户端的AI翻译工具。

以AutoGLM为引,分析AI执行桌面操作任务的产品形态
提示:这并不是一个好的任务描述,因为网站并没有提供站内搜索功能,以及明确的AI翻译工具入口,更好的任务描述是:从https://sharenet.ai/tag/aifanyi/ 开始翻页,从列表信息中找到所有免费且有客户端的AI翻译工具。
3. beobachten Sie den Prozess der Aufgabenausführung (dies ist ein Screenshot eines Teils der Seite, die automatisch bei der Ausführung des Tools besucht wird)
Reflexionen 以AutoGLM为引,分析AI执行桌面操作任务的产品形态

Suchen Sie zunächst das Suchfeld, geben Sie "AI Translation" ein und führen Sie die Suche aus. 以AutoGLM为引,分析AI执行桌面操作任务的产品形态

Rufen Sie die Bing-Suchoberfläche auf (das Suchfeld der Website ist ein Sprung zur Bing-Suche) und beginnen Sie mit dem Besuch des Links... 以AutoGLM为引,分析AI执行桌面操作任务的产品形态
Beim Aufrufen des zweiten Links wurde ein kategorisierter Katalog von KI-Übersetzungstools gefunden 以AutoGLM为引,分析AI执行桌面操作任务的产品形态
Durchsuchen Sie die kategorisierte Liste der KI-Übersetzungsprogramme Link für Link und führen Sie ein automatisches Blättern durch. 以AutoGLM为引,分析AI执行桌面操作任务的产品形态
Besuchen Sie die zweite Seite und starten Sie die Zusammenfassungsaufgabe 以AutoGLM为引,分析AI执行桌面操作任务的产品形态
Ausgabe des vollständigen Forschungsberichts 以AutoGLM为引,分析AI执行桌面操作任务的产品形态

4. nicht durch die wichtige Test-Link "Login" Interessenten ihre eigene Aufgabe zu starten, um den Interaktionsprozess zu beobachten, ist die Aufgabe in der Lage, die Login-Interaktion Aktion hervorzurufen. (Melden Sie sich zuerst von Xiaohongshu ab)

Das Wissen des Kleinen Roten Buches über DEEPSEEK, das Videos erzeugt, sammeln

 

ausfindig machen.

Anhand der erzielten Ergebnisse lässt sich rückwärts analysieren, dass die Aufforderungen des Tools auf das Schreiben einer Forschungsarbeit ausgerichtet sind und sich nicht für andere Aufgabentypen eignen.

 

Kernkompetenzen

  • Generierung von Pendenzenplänen
  • Den Browser aufwecken
  • In-Browser-Ansicht (nur Text), Klicken, Tippen
  • Knoten zur Aufgabenbeurteilung (teilweise): Web-Browsing abgeschlossen, Seite beobachten und die nächste Aufgabe beurteilen, beurteilen, ob eine Anmeldung erforderlich ist, Ende der Informationsbeschaffung

Automatisierung rund um die visuellen Interaktionen des Browsers, aber nur für das Sammeln von Informationen und das Schreiben von Forschungsberichten, es sieht nicht so aus, als ob es zu diesem Zeitpunkt alle seine Fähigkeiten freigibt, insbesondere mit clientseitigen Ergänzungen, und sollte in der Lage sein, später mehr Fähigkeiten zu integrieren.

 

Kurz gesagt: AutoGLM contemplation vs. Wisdom Spectrum Bull Difference

Erstere bedient den Browser visuell, automatisiert den Prozess der Informationssammlung und erzeugt "Eingabe"-Aktionen nur für die Suche und den Besuch von Seiten.

Letzterer bedient den Desktop visuell und ist nicht auf die Automatisierung der Informationsbeschaffung beschränkt, sondern kann den Desktop frei bedienen, um die Aufgabe zu erledigen.

 

Zusammenfassung in einem Satz Unterschiede zwischen AutoGLM Contemplation und ClearSpeak Browser Plugin

Ersterer bedient den Browser visuell und kann später als PC-Client mit weiteren Schnittstellen interagieren.

Letzteres hat immer noch die gleiche visuelle Manipulation der Browser-Fähigkeiten und kann als Browser-Plug-in verwendet werden, um nativ mit den Informationen auf der besuchten Seite zu interagieren.

 

Zurück zum Thema KI, die Aufgaben der Desktop-Bearbeitung übernimmt

Lassen Sie uns mit einer Frage beginnen:

AutoGLM Kontemplative Kernkompetenzen Browser-Nutzung Beides, Verfassen von ausführlichen Forschungsberichten STURM Warum sollten Sie AutoGLM Contemplation verwenden?

Die Antwort wird im Folgenden zusammengefasst:

AutoGLM Contemplation ist ein auf den Verbraucher ausgerichtetes, produktspezifisches Tool, das einen vollständigen Prozess der Informationsbeschaffung und der Erstellung von Forschungsberichten umfasst.

Es ist nicht erforderlich, komplexe lokale Installationsumgebungen zu konfigurieren und die Cloud-Computing-Leistung für die Zusammenarbeit bei lokalen Interaktionen zu nutzen.

STORM ist eine feste Quelle für die Sammlung von Informationen ohne Zugang zu nicht offenen Informationen, während AutoGLM eine Automatisierung mit Hilfe des Browsers vorsieht, um Folgendes zu erreichenNicht offene Informationssammlung.

 

Zu diesem Zeitpunkt werden Sie vage einige Unterschiede zwischen den Werkzeugen erkennen? In der Tat ist das Problem sehr einfach, die folgenden von der Zusammenfassung der Desktop-Zeichen-Automatisierungs-Tools zu kämmen beginnen.

 

Zwei Arten von Lösungen für die Automatisierung von Desktop-Aufgaben

1. traditionell feste Ankerpunkte setzen und prozessweise ausführen. Beispiel: Microsoft PA, Shadowblade.

2. rein visuelle Interaktionen unter Verwendung von Browser-Use zur Unterstützung bei großen Modellbeurteilungen und zur Erzeugung von Interaktionen. Beispiel: AutoGLM-Betrachtung.

3) Hybrid: Shadowblade kann auch auf einem festen Arbeitsablauf basieren, wobei einige Knoten (insbesondere Inhaltsextraktionssitzungen) rein visuelle Interaktionen verwenden. Typischer ist Microsofts automatisiertes Kundendienstplanungs-Tool, nach der Einführung von KI, so dass der Kundendienst in der festen SOP-Prämisse, menschlicher arbeitet.

 

Wenn wir uns nun auf rein visuelle Interaktionslösungen konzentrieren, sollten wir uns einen Namen einfallen lassen... Desktop Task Automation Intelligence

 

Was kann eine intelligente Desktop-Automatisierung leisten?

Allgemeine Kompetenz:

Visuelle Erkennung des Desktops, Bedienung der Desktop-Funktionen

 

Skalierbarkeit:

Einzelne Intelligenz, Multi-Intelligenz bei der Ausführung von Aufgaben.Multiple Intelligenzen werden im Allgemeinen für die Aufgabenplanung, die Verzweigung von Aufgaben, die Aufgabenkoordination und die Informationsverdichtung eingesetzt.

Führen Sie Desktop-Vorgänge aus, indem Sie sich auf ein festes "Werkzeug" oder einen festen "Arbeitsablauf" für eine bestimmte Aufgabe beziehen.Zum Beispiel: Berechnungen, Programmierung, Suche nach qualitativ hochwertigen Informationsquellen. Was Manus für alle so leistungsfähig macht, ist die Integration von Programmierwerkzeugen, um einige Verzweigungsaufgaben zu erledigen.

Erweitern (Zugriff) auf lokale und entfernte Datenquellen.

 

Beschränkungen:

Intelligenzen zur Automatisierung von Desktop-Aufgaben müssen den Desktop nicht unbedingt rein visuell bedienen. Wenn meine Zweigstellenaufgabe die Suche nach "Wissen" umfasst, ist es vielleicht besser, direkt mit den Suchergebnissen von "Wissen" zu arbeiten, und die Bedienung des Desktops ist stattdessen ineffizient. Daher kann eine vernünftige Erweiterungsmöglichkeit dazu beitragen, den Wert von Desktop-Intelligenzen zu realisieren.

 

Wozu Desktop Task Automation Intelligence gut ist

AutoGLM contemplation beschränkt sich auf die Suche nach nicht offenem Wissen, was für Wissenssuchszenarien gut geeignet ist, aber der Punkt, an dem es von größerem Wert sein kann, ist bei der Automatisierung von Vorgängen, bei denen die Schnittstelle dynamische Informationen enthält und sich wiederholt. Diese Konvergenz Die Automatisierung der Aufgabenausführung durch die KI und die anschließende Speicherung des Aufgabenausführungsprozesses, so dass dieser zu einem späteren Zeitpunkt erneut durchlaufen werden kann, ist gut gelungen.

Zusammenfassen: Informationen überprüfen, sich wiederholende Aufgaben ausführen.

 

Desktop Operating Tasks Produktportfolio

Der obige Teardown enthält genügend Informationen, um die aktuelle Form ähnlicher Produkte zusammenzufassen.

Letztendlich ist es nichts anderes als eine Kombination der folgenden Fähigkeiten, lokal oder in der Cloud, die Gestaltung des Bereichs der verarbeiteten und unverarbeiteten Aufgabenausführung und schließlich die Präsentation der Art der ausführbaren Aufgabe für den Benutzer.

Alle denkbaren ähnlichen Instrumente lassen sich in der nachstehenden Tabelle zusammenfassen.

以AutoGLM为引,分析AI执行桌面操作任务的产品形态
© urheberrechtliche Erklärung
AiPPT

Ähnliche Artikel

Keine Kommentare

keine
Keine Kommentare...