Percorsi di intelligenza. Artificiale

Di Piero Chiabra, Associazione DiGenova

Abstract

Pathways of Intelligence. Artificial one.

Artificial intelligence is one of the most widely discussed technical topics today. Unfortunately, discussion on this subject is quite often confused and misleading, as, sometimes, matters are completely misunderstood, up to the point that some speakers do not even know exactly what they are talking about. In particular, people tend to ignore the current, strong limitations of current AI algorithms, especially neural networks, amongst which the worst one may be the fact that current AI systems can deal with a single issue, on which they are strongly specialized, and completely lack the possibility of dealing with different problems (e.g. play chess and walk). The dream of AGI, Artificial General Intelligence, that people are increasingly talking about, is, today, nothing but a dream.

Things, however are changing. Google has worked out a new AI systems architecture, called PATHWAYS, which is briefly described in this article, under which one AI system could learn how to cope with different problems, indeed even hundreds or thousands of them,  by “combining” the expertise of some basic models, which this novel architecture allows to host on the same neural network. This, although not still qualifying as AGI, is a very interesting approach, which will greatly enhance the already very relevant potential of AI systems on dealing with problems and situations of any kind.

Should we worry?

————-

Il tema dell’Intelligenza Artificiale è forse oggi il tema tecnologico più trattato nel dibattito comune.

Infiniti articoli, discussioni, dibattiti, sono dedicati a questo soggetto, e da questi emergono le più svariate e, talvolta, strampalate conclusioni sulle possibili prospettive a lungo termine che questa tecnologia potrà generare in termini di applicazioni pratiche e, in ultima analisi, di ricadute sul futuro stesso dell’umanità.

Peccato che, in buona parte di questi dibattiti, i partecipanti spesso e volentieri non sappiano di cosa stiano parlando.

La discussione in merito all’AI, infatti, è spesso sensazionalistica e fuorviata, a partire dal termine stesso che definisce la disciplina, “Intelligenza Artificiale”, che sembrerebbe voler definire un tentativo di ricreare l’intelligenza umana quando, questa intelligenza umana, neanche ancora sappiamo cosa esattamente sia. Ma vediamo, piuttosto, in cosa consiste ciò che oggi abbiamo, e che con questo pomposo termine di “intelligenza artificiale” viene definito.  

In generale, vengono definiti come sistemi di “intelligenza Artificiale” dei particolari algoritmi software i quali hanno la capacità, all’interno di un certo insieme di dati (una biblioteca di immagini, un archivio di transazioni economiche, un insieme di dati sensoristici, etc. etc.), di riconoscere “schemi”, nel senso più generale del termine, ed evidenziare, sulla base di quanto appreso dalla conoscenza di quei dati, questi schemi e ricorrenze in nuovi assiemi di dati che si presentano.  La cosa che li differenzia dal software tradizionale, è gli algoritmi di AI sono in grado di riconoscere questi “schemi” anche dove non sono specificati chiaramente, e anche in condizioni in cui l’identificazione dello schema è soggetta ad incertezze. Un sistema di AI sarà, ad esempio, in grado di riconoscere una certa forma, ad esempio una bottiglia, di un tipo mai visto prima, e in una figura sottomessagli a caso e mai vista prima, non perché qualcuno gli abbia dato la definizione univoca e rigorosa di cosa è una bottiglia, ma perché avrà imparato, dall’esame di migliaia, o milioni, di immagini preesistenti cosa è una bottiglia e cosa non lo è, e lo avrà potuto fare perché durante questo esame (detto comunemente fase di “teaching”), qualcuno gli avrà detto, per ciascuna di quelle immagini, cosa è una bottiglia e cosa non lo è. E la decisione che la nuova immagine rappresenta, in effetti, una bottiglia, sarà data sempre non come una indicazione analitica, ma come una scelta in termini di probabilità (“questa immagine è una bottiglia al …%”), lasciando poi a qualcun altro il trarre conclusioni.

È evidente come questo nuovo modo di elaborare dati consenta di affrontare una vasta classe di problemi che sarebbero altrimenti irrisolvibili con sistemi software tradizionali, in particolare tutti quei problemi che richiedono l’effettuazione di decisioni sulla base di situazioni incerte, o troppo difficili da modellare in modo analitico e deterministico. È anche vero che questo modo di procedere imita, o tenta di imitare, le modalità di funzionamento del cervello umano (infatti, tali sistemi sono spesso implementati tramite algoritmi software, detti “reti neurali”, che cercano di imitare una rete di neuroni cerebrali). Ma la differenza rispetto ad una qualsiasi forma di elaborazione “intelligente” dei dati, qualunque cosa noi definiamo con questo termine, è lampante. Ciò che manca, soprattutto, è la totale mancanza di plasticità della procedura di analisi, vale a dire l’impossibilità di adattare il meccanismo di riconoscimento degli schemi a tipologie di problemi diverse da quelle originariamente impostate. Un sistema AI di che si occupa di un problema in un certo contesto non è in grado di operare in altri contesti.  Noi possiamo fare un sistema di AI che batta il campione del mondo di scacchi, ma, dopo che il campione del mondo di scacchi si alza dal tavolo e, camminando tristemente, se ne va, il sistema di intelligenza artificiale che lo ha così brillantemente sconfitto, anche se avesse un paio di gambe meccaniche, non sarebbe capace di imitarlo.  Se qualcuno provasse a insegnargli a camminare non solo non ci riuscirebbe, ma altererebbe i suoi “percorsi neurali” interni, che sono stati impostati durante la fase di teaching in modo ottimizzato per vincere agli scacchi, e alla fine il povero sistema di AI non solo non sarebbe in grado di camminare, ma non sarebbe neanche più capace di giocare agli scacchi in maniera efficace. Fino ad oggi, quindi, i sistemi di AI sono efficaci soltanto per affrontare applicazioni rigidamente specifiche, e il sogno, avanzato da qualcuno, di una AGI, Artificial General Intelligence, in grado di adattarsi a risolvere qualunque problema sviluppando da sola i propri modelli di interpretazione del mondo, è per l’appunto un sogno.

Ma qualcosa sta iniziando a cambiare.

Attualmente, come accennato, ogni sistema di AI è basato su un certo tipo di algoritmo, noto come “rete neurale”, che tenta di imitare il funzionamento di una rete di neuroni, ed è per l’appunto costituito da una rete di nodi, o “neuroni”, interconnessi da una serie di collegamenti pesati relativamente per importanza.  Attualmente, un sistema AI che affronti un singolo problema ha, come detto, subìto un processo di teaching per quel problema,  che ha “generato” una particolare configurazione di questi collegamenti e dei loro pesi relativi, la quale rappresenta il “modello comportamentale” che rappresenta l’”esperienza” accumulata dal sistema, e permette al sistema di affrontare il problema su cui è stato specializzato. Ogni rete neurale ha la totalità dei propri collegamenti strutturata per affrontare quel determinato problema, e quindi non ha la possibilità di affrontarne altri.

Ma ora, Google ha presentato una nuova architettura per sistemi di Intelligenza Artificiale, chiamata PATHWAYS, percorsi. Questa architettura supera completamente questa difficoltà, permettendo ad un singolo sistema, ad una singola rete neurale di imparare ad operare non in un singolo contesto, ma in molti e diversi, affrontando e risolvendo centinaia di problemi distinti, in ambiti del tutto differenti, e, soprattutto, di imparare a risolverne sempre di nuovi, magari più facilmente, in un tempo inferiore e, in un futuro, anche autonomamente. 

Come ci riesce? Innovando radicalmente il modo in cui i modelli relativi a ciascun singolo contesto/problema sono rappresentati all’interno della rete neurale. Mentre oggi la rappresentazione di un modello riguarda l’intero sistema di connessioni di tutti i neuroni della rete, Il nuovo sistema prevede che il teaching della rete (una rete di grandi dimensioni, con moltissimi neuroni) venga effettuato su una serie di problemi diversi, e che ciascun modello venga generato attivando solo connessioni tra neuroni vicini tra loro.  In questo modo, la gestione di ogni singolo problema, è demandata ad una parte della rete, e non a tutta. E molti modelli, relativi a diversi problemi e contesti, possono quindi essere ospitati sulla rete contemporaneamente, in diverse aree della stessa. Ora, supponiamo che la rete si trovi a dover affrontare un problema in un contesto per cui non è stata addestrata, e che il sistema possa effettuare “esperimenti” su questo problema, facendo delle azioni di prova in questo contesto e ricevendo dall’esterno un giudizio se la mossa è stata positiva  o meno. L’architettura PATHWAYS, sulla base dei risultati di questi esperimenti, traccerà una serie di interconnessioni tra le aree, di “percorsi”, appunto, i quali collegheranno i diversi modelli in modo tale che, una volta che, ripetendo gli esperimenti, sarà stata stabilita una rete di percorsi ottimale per quel nuovo contesto, il sistema sarà in grado, attingendo tramite queste connessioni la sua esperienza “un po’ di qua e un po’ di là” tra i diversi modelli, di risolvere il problema in maniera soddisfacente. Il sistema può, quindi, “imparare” a risolvere nuovi problemi, in contesti del tutto originali, E il grande, enorme vantaggio è che l’architettura PATWAYS permette che queste “reti di modelli” siano sovrapponibili, e in grado di coabitare nello stesso sistema, permettendo così, tramite l’esperienza accumulata inizialmente sui modelli di base, di affrontare e risolvere migliaia, milioni di problemi del tutto nuovi, in contesti del tutto originali.

Tutto ciò è in, ultima analisi, in modo in cui funziona il nostro cervello, nel quale varie aree dello stesso sono demandate ad affrontare specifiche problematiche (area della mobilità, area della visione, area della percezione uditiva, area della parola, etc.), e queste aree vengono poi coordinate nello svolgimento di specifiche azioni. Se l’algoritmo AI che giocava a scacchi di cui abbiamo parlato fosse stato realizzato con l’architettura PATHWAYS, avrebbe anche potuto, senza smettere di saper giocare a scacchi, imparare a camminare sulle sue gambe meccaniche. O a cucinare un uovo strapazzato. O a scrivere una poesia, sullo stile di Baudelaire. O a fare alcune di queste cose insieme. In questo senso l’architettura PATHWAYS è, quindi, un grande passo avanti verso il conseguimento della AGI, la Artificial General Intelligence, di cui si era parlato, e che costituirebbe un’autentica rivoluzione nella storia umana.

Non siamo ancora arrivati all’AGI, neanche con l’architettura PATHWAYS. I modelli di base devono essere inseriti con le procedure tradizionali di teaching, e il sistema, se può affrontare nuovi problemi, non può modificare questi modelli di base che costituiscono la sua “esperienza di fondo”. Manca ancora, quindi, quella che noi chiamiamo “creatività”, ossia la capacità di un individuo di creare i suoi propri paradigmi, e ideare qualcosa che sia realmente innovativo, e non la ricombinazione di elementi preesistenti (ma quanti esseri umani sono così, e passano la loro vita affrontando le varie questioni sulla base dei propri innati pregiudizi e delle loro concezioni stereotipate, senza mai maturare un miglioramento delle loro intime convinzioni? Forse la maggioranza?). Stiamo però arrivando al punto di costituire sistemi AI che saranno, e già in parte sono, in gradi di infrangere barriere, e di svolgere attività che si riteneva fino a poco tempo fa di esclusivo, eterno appannaggio degli esseri umani, quali la comprensione profonda del linguaggio, la creazione artistica (se pur accademica, niente innovazione…), la formulazione di decisioni strategiche in molti settori, e così via.

È forse arrivato il momento di cominciare a preoccuparsi?

Per saperne di più

https://www.nextbigfuture.com/2022/02/174523.html

https://blog.google/technology/ai/introducing-pathways-next-generation-ai-architecture/