Principale Innovare L'intelligenza artificiale di Google 'Alpha Go Zero' ha appena premuto Reset su come imparare

L'intelligenza artificiale di Google 'Alpha Go Zero' ha appena premuto Reset su come imparare

Il Tuo Oroscopo Per Domani

Ricordi (vagamente) come hai imparato a camminare, parlare, andare in bicicletta o guidare? Era disordinato e pieno di errori, ma le abilità che hai imparato in quel modo sono rimaste. Al di fuori dei sistemi viventi, è stato difficile strutturare algoritmi sufficientemente forti da accogliere 'l'esperienza di vita reale' e sviluppare comportamenti appiccicosi e adattabili per l'intelligenza artificiale.

Bene, Alpha Go Zero l'ha appena fatto.

“Parte da una tabula rasa e si risolve solo da sé, solo dal gioco personale, e senza alcuna conoscenza umana, o dati umani, o caratteristiche, o esempi, o intervento da parte degli umani. Scopre come giocare a Go dai primi principi', afferma David Silver, il professore di DeepMind.

L'IA ha avuto diverse iterazioni, ognuna più intelligente e più capace di quella precedente. La versione precedente utilizzava un enorme database di giochi precedenti insieme a una serie di algoritmi che lo indirizzavano verso la vittoria. Questo approccio ha portato alla sconfitta del giocatore professionista Go, campione del mondo in carica. Nel poker, l'AI Libratus ha recentemente scuoiato i migliori giocatori di poker del mondo di quasi $ 2 milioni, anche imparando attraverso l'auto-gioco invece dei dati di gioco umani.

quanti anni ha la vasca degli squali lori greiner

Ora, in questa ultima versione di Alpha Go, il programma di intelligenza artificiale ha insegnato si come giocare a Go - senza background umano.

Eseguendo milioni di simulazioni di gioco contro se stesso, ci sono voluti 40 giorni per imparare, da zero, come battere la versione campione del mondo di se stesso. Questo è davvero rivoluzionario, non solo per Go, ma anche per il modo in cui vengono scoperte nuove conoscenze. Quanto è accurata o completa la tua esperienza nel dominio? c'è Un sacco altro da scoprire, è ciò che ci dice questo affascinante esperimento di apprendimento con Alpha Go Zero.

'L'idea di Alpha Go non è quella di uscire e sconfiggere gli umani, ma in realtà di scoprire cosa significa fare scienza, per un programma essere in grado di imparare da se stesso cos'è la conoscenza', secondo Silver in un post di YouTube su il raggiungimento.

Il team di Alpha Go Zero Deep Mind lo chiama apprendimento del primo principio, 'tabula rasa' (tabula rasa).

'Se puoi raggiungere tabula rasa imparando, hai un agente che può essere trapiantato dal gioco di Go a qualsiasi altro dominio, e le specifiche del gioco in cui ti trovi, ti vengono in mente un algoritmo così generale che può essere applicato ovunque,' dice . Questa è un'idea provocatoria quando estendi il concetto. Pensa a cosa potremmo fare con una serie di algoritmi di apprendimento potenti che potrebbero affrontare sistematicamente problemi difficili e apprendere più velocemente della conoscenza collettiva della nostra civiltà. . . in giorni, non decenni.

quanto è alto Brian Quinn

Per ora, il grande vantaggio è che 'gli algoritmi contano molto più dell'elaborazione o dei dati disponibili', ha affermato Silver. Questo da solo è un punto di svolta nel modo in cui ci avviciniamo all'estensione del mondo conosciuto. Mentre Alpha Go funziona con circa 25 milioni di dollari in hardware - non è esattamente un sistema leggero - sai che i guru dell'intelligenza artificiale hanno lavorato a lungo per creare set di dati più puliti e migliori. Oggi, molti set di big data sono considerati troppo rumorosi, pieni di dati errati, per addestrare con precisione un'intelligenza artificiale. Se l'intelligenza artificiale sta imparando dai dati e i dati sono cattivi, non impara. Grande problema.

E se non avessi bisogno di dati puliti, ma solo di esperienza e l'intelligenza artificiale potesse allenarsi da sola?

Questo è l'eccitante risultato di Alpha Go Zero. Anche se si trova nel mondo dei giochi di nicchia e basato su regole, ha grandi implicazioni in ogni settore che lavora da regole fisiche: si pensi alla chimica, al traffico, alla biologia, alla farmacologia, ai viaggi, alla logistica e alla produzione. Se siamo in grado di progettare regole così flessibili che possono funzionare da un'esperienza più ampia e così direzionali da creare sempre abilità più forti, come Alpha Go Zero, allora è possibile ottenere l'intelligenza artificiale che guida i sistemi. Questi sistemi non avrebbero bisogno di dati esterni, non avrebbero problemi di pulizia dei dati e non avrebbero bisogno di rallentamenti umani. Questo è in parte il motivo per cui la società madre di Google, Alphabet, ha scommesso sull'intelligenza artificiale e sta investendo rapidamente nell'intelligenza artificiale. (Amazon sta anche investendo nell'intelligenza artificiale, come la sua ultima acquisizione di intelligenza artificiale BodyLabs.)

jack gleeson regno di fuoco

Il professore di Deep Mind David Silver afferma: 'Il fatto che abbiamo visto un programma raggiungere prestazioni di alto livello... dovrebbe significare che ora possiamo iniziare ad affrontare alcuni dei problemi più impegnativi e di maggiore impatto per l'umanità'.

Questo post è stato aggiornato per chiarire che AI ​​Libratus ha recentemente battuto i migliori giocatori di poker utilizzando una strategia che prevede il gioco autonomo piuttosto che i dati inseriti dall'uomo.