| Übersicht |
Project Mariner ist ein experimenteller KI-Agent von Google DeepMind, der komplexe Aufgaben direkt im Chrome-Browser automatisiert. Er nutzt das Gemini 2.0-Modell, um Webinhalte in Echtzeit zu verstehen und mit ihnen zu interagieren. Er fungiert als persönlicher Assistent, der Webseiten navigiert, Formulare ausfüllt und mehrstufige Prozesse für den Benutzer ausführt. |
| Hauptmerkmale und Vorteile |
- Multimodales Verständnis: Interpretiert verschiedene Webelemente, darunter Text, Bilder, Code und Formulare, und ermöglicht so das Verstehen und Interagieren mit komplexen Webseiten.
- Lehren und Wiederholen: Benutzer können eine Aufgabe einmal vorführen und die KI lernt, den Arbeitsablauf für ähnliche zukünftige Aufgaben zu replizieren, wodurch die Effizienz im Laufe der Zeit gesteigert wird.
- Gleichzeitige Aufgabenverwaltung: Der Agent kann bis zu 10 Aufgaben gleichzeitig verarbeiten und in Cloud-basierten virtuellen Maschinen ausgeführt werden, um lokale Ressourcen freizugeben.
- Echtzeit-Interaktion: Beobachtet die Anzeige des Browsers, plant Aktionen basierend auf den Zielen des Benutzers und führt Aufgaben aus, während der Benutzer informiert bleibt und die Kontrolle behält.
|
| Anwendungsfälle und Anwendungen |
- Arbeitssuche: Verwenden Sie Lebenslaufinformationen, um personalisierte Stellenangebote auf Plattformen wie Climatebase zu finden.
- Online Einkaufen: Navigieren Sie zu Online-Shops, um Artikel zu kaufen oder Dienstleistungen zu finden, z. B. die Beauftragung eines Taskers für die Möbelmontage.
- Rezeptverwaltung: Identifizieren fehlender Zutaten aus einem in Google Drive gespeicherten Rezept und Bestellen dieser über Dienste wie Instacart.
|
| Wer nutzt es? |
- Forscher & KI-Enthusiasten: Neue Grenzen in der KI-Browserautomatisierung und Webinteraktion erkunden.
- Entwickler und technische Innovatoren: Integration von KI in Online-Workflows.
- E-Commerce- und Datenanalysten: Automatisierung der Online-Produktverfolgung und Geschäftsforschung.
|
| AnzeigenPreise |
- Google AI Ultra Plan: 249.99 $/Monat für US-Abonnenten.
- Free Access: Während der experimentellen Phase für ausgewählte vertrauenswürdige Tester verfügbar.
|
| Schlüsselwörter |
KI-Agent, Browser-Automatisierung, Multimodale KI, Aufgabenautomatisierung, Chrome-Erweiterung, Gemini 2.0 |
| App verfügbar? |
- Chrome-Erweiterung: Experimentelle Version für vertrauenswürdige Tester verfügbar.
- Integration: Geplante Integration mit Gemini API und Vertex AI für eine umfassendere Anwendungsentwicklung.
|