Waymo presenta il modello mondiale per la simulazione di guida autonoma iperrealistica
Il passo avanti di Waymo nella simulazione di guida autonoma
Waymo, la sussidiaria di Alphabet specializzata nella guida autonoma, ha presentato il Waymo World Model, un sistema di intelligenza artificiale generativa all'avanguardia progettato per simulare scenari di guida realistici su una scala e con una fedeltà senza precedenti. Questo sviluppo segna una pietra miliare importante nel percorso di Waymo volto a migliorare la sicurezza e la scalabilità della sua tecnologia di guida autonoma.
Il Waymo World Model è costruito su Genie 3 di Google DeepMind, un modello mondiale di scopo generale in grado di generare ambienti 3D fotorealistici e interattivi. Sfruttando l'immensa conoscenza del mondo di Genie 3, Waymo può simulare eventi estremamente rari, come incontrare un tornado o un elefante sulla strada, che sono quasi impossibili da catturare su larga scala nella realtà.
Componenti e capacità chiave
Il Waymo World Model comprende diversi componenti chiave che lavorano insieme per produrre scenari di guida altamente realistici. Questi includono:
- Un modulo di generazione di scene che produce immagini multi-vista ad alta risoluzione e dati lidar corrispondenti per ambienti nuovi.
- Un modello di comportamento degli agenti che predice e genera i movimenti degli altri utenti della strada con dinamiche e schemi decisionali realistici.
- Una capacità di simulazione a circuito chiuso, che consente al Waymo Driver di interagire con l'ambiente simulato in tempo reale.
Il Waymo World Model offre un forte controllo sulla simulazione attraverso tre meccanismi principali: controllo dell'azione di guida, controllo del layout della scena e controllo linguistico. Ciò consente agli ingegneri di Waymo di modificare le simulazioni con semplici prompt linguistici, input di guida e layout di scena, permettendo la creazione di scenari personalizzati e l'esplorazione di
Related News

Cantante AI 'Eddie Dalton' Domina le Classifiche di iTunes, Scatenando un Dibattito nell'Industria

Gemma 4 E2B Alimenta la Chat AI in Tempo Reale su Dispositivo nel Progetto Parlor

GuppyLM: un piccolo progetto LLM demistifica l'addestramento dei modelli AI

Gli agenti di codifica AI abilitano gli sviluppatori a costruire strumenti complessi più velocemente

BrowserStack accusato di aver fatto trapelare indirizzi email degli utenti alla piattaforma di intelligence commerciale

