Tag

machine learning

Browsing

Spunti e riflessioni sulla dinamica lavorativa

L’orizzonte che ci si prospetta dinanzi a noi è decisamente incerto, tenendo conto solo dei possibili scenari legati allo sviluppo tecnologico. Non ritengo necessario giungere a conclusioni affrettate, ma reputo indispensabile immaginare piccoli e semplici cambiamenti di cui siamo già stati “vittime” in passato.

Lo sviluppo dell’intelligenza artificiale progredirà senza ombra di dubbio, come è sempre stato e sempre sarà per ogni strumento e tecnologia inventata dall’uomo. Abbiamo già vissuto durante le prime rivoluzioni industriali, processi di automazione della produzione che hanno portato ad una sostituzione dell’uomo con determinate macchine. Ma fino a che la produzione necessaria al sostentamento globale non sarà completamente automatizzata, quale futuro ci si prospetta di fronte a noi?

Quello che stiamo vivendo in questo periodo storico coincide, come dice Luciano Floridi, con la quarta rivoluzione (quella digitale). Contemporaneamente, ci stiamo avvicinando al concetto di Industria 4.0 ovvero un insieme di processi di automazione industriale mirati a migliorare le tecnologie di produzione e la qualità del lavoro.

Il concetto di industria 4.0 prende in considerazione il concetto di “fabbrica intelligente [1]”, che si compone di tre diverse parti:

1) Smart Production (produzione intelligente): consistono in nuove tecnologie in grado di creare maggior collaborazione tra uomo, macchina e strumenti produttivi.

2) Smart Service (Servizi intelligenti): consistono in una serie di infrastrutture informatiche e tecniche in grado di integrare sistemi e aziende in modo collaborativo.

3) Smart energy (energie intelligenti): ovvero l’utilizzo di risorse sostenibili.

Per rendere possibile questa rivoluzione dal punto di vista industriale, secondo il Boston Consulting ci sarà bisogno di tecnologie chiamate “abilitanti”: tra queste figurano sistemi avanzati di produzione, simulatori, dispositivi di realtà aumentata, Cloud, sicurezza informatica e Big Data Analytics.

Analizzando i requisiti e le componenti di tale processo innovativo, salta all’occhio come oltre ad i processi di automazione dei sistemi di produzione, giochino un ruolo di fondamentale importanza tutte le competenze e le informazioni legate al “digitale”.

Ma tali fabbriche intelligenti, dotate di macchine intelligenti, non ci rubano il lavoro: è più probabile che ci liberino da esso. Devono sostituirci nelle mansioni più faticose e pericolose, e anche in quelle che richiederebbero per noi uno sforzo mentale enorme.

Come dice Luciano Floridi nel suo saggio “La quarta rivoluzione [2]” sono state create in un “ambiente digitale” che permette loro di esprimersi seguendo leggi che noi stessi gli abbiamo imposto. Gli argomenti trattati all’interno del saggio li analizzerò nel quarto capitolo.

© Cpyright. Estratto dalla tesi di Laurea in Filosofia, Teorie e sistemi dell’intelligenza artificiale, a cura di Federico Malpighi. Alma Mater Studiorum Università di Bologna. Materiale pubblicato per fini didattici e di ricerca con il permesso dell’autore. Riproducibile solo con citazione della fonte originale.


[1] https://it.wikipedia.org/wiki/Industria_4.0#cite_note-8 URL consultato in data 28 agosto 2020.

[2] Luciano Floridi, La quarta rivoluzione. Come l’infosfera sta trasformando il mondo, Raffaello Cortina Editore, 2014, p. 106.

La quarta rivoluzione

Luciano Floridi ha pubblicato un libro intitolato “La quarta rivoluzione” in cui si impegna a rispondere a domande generali riguardanti la comprensione dell’evoluzione dei sistemi informatici e di individuare e discutere i problemi legati ad essa. Per Floridi, il passaggio dalla carta al digitale ha portato il nostro essere a trasformarsi in qualcosa che egli definisce come “inforg” ovvero entità composte di informazioni, in grado di condividerle non solo tra umani ma anche con le macchine presenti.

«Stiamo lentamente accettando l’idea per cui non siamo agenti newtoniani isolati e unici, ma organismi informazionali, inforg, reciprocamente connessi e parte di un ambiente informazionale (infosfera), che condividiamo con altri agenti informazionali».

I risultati di tali “inforg” possiamo notarli con le generazioni nate dopo gli anni duemila: essi cercano di interagire con qualsiasi cosa come se questo disponesse di una predisposizione digitale. La differenza con le generazioni precedenti è concreta: la generazione X (che riguarda i nati tra il 1960 e il 1980) non ha la stessa predisposizione al digitale della seconda (la generazione Y, che riguarda i nati tra il 1980 e gli anni 2000), né tanto meno con l’ultima.

Questo divario generazionale, secondo Floridi, creerà problemi non solo dal punto di vista digitale, ma anche da quello sociale e culturale. E dal momento che trascorriamo sempre più tempo all’interno dell’infosfera, la nostra quotidianità sarà sempre più plasmata in base a ciò che succede a livello virtuale e digitale. Preoccuparsi del continuo distacco con la natura è un’azione ingiustificata: per Floridi se non possiamo competere con le macchine e gli algoritmi che sono in grado di codificare miliardi di dati al secondo, deteniamo ancora la caratteristica di poter comprendere i significati degli eventi che accadono intorno a noi.

In via definitiva stiamo tornando al discorso che avevamo intrapreso qualche capitolo indietro: significato ed intenzionalità sono gli attributi che ci rendono umani, al di sopra delle complessità mentali inferiori che possediamo rispetto ad una determinata intelligenza artificiale.

E nonostante questo, la nostra identità è sempre più orientata ad essere digitalizzata: onlife, come dice Floridi. La concezione che abbiamo di noi stessi è diventata quasi più importante sui vari social network piuttosto che nella vita reale, entrando in una sorta di” flusso continuo” fatto di messaggi istantanei, foto e video. Il trasferimento della nostra identità sul piano digitale ha, di conseguenza, portato un trasferimento delle situazioni reali sullo stesso piano: app per incontri, messaggistica istantanea, social media.

«Le micronarrazioni che produciamo e consumiamo stanno cambiando anche i nostri sé sociali e quindi il modo in cui ci percepiamo».[1]

Definire sé stessi risulta sempre più difficile in un mondo oramai sempre più condizionato da realtà parallele. Ma risulta quasi fisiologico, se accettiamo l’idea che stiamo vivendo una vera e propria rivoluzione, la quarta secondo Luciano Floridi. La prima è stata quella di Nicolò Copernico, che ha posizionato la terra non al centro dell’universo, facendo cadere la posizione centrale dell’uomo. Caduta la nostra centralità, ci siamo avvicinati alla seconda rivoluzione: nel 1859 Darwin pubblicò l’origine delle specie. Al suo interno, è presente la spiegazione secondo cui ogni essere vivente è l’evoluzione nel tempo da parte di progenitori comuni attraverso un processo di selezione naturale. Siamo passati da rivoluzione ad evoluzione, come ci fa notare Floridi.

«Questa volta fu la parola “evoluzione” ad acquisire un nuovo significato».[2]

Ma anche questa volta è avvenuto un nuovo spostamento: ci siamo allontanati dal centro del mondo naturale. La terza rivoluzione avvenne per mano di Sigmund Freud: egli sostenne che la mente umana è inconscia e soggetta a meccanismi di difesa come quello della repressione. Ennesimo spostamento, questa volta dal centro della coscienza verso la parte più buia della nostra mente.

La linea comune di queste rivoluzioni è stata il progressivo allontanamento della posizione centrale dell’uomo rispetto a diverse concezioni: non siamo al centro dell’universo, né al centro del mondo biologico, né tanto meno al centro della nostra stessa volontà. La quarta rivoluzione che stiamo vivendo, senza rendercene pienamente conto ed aspettando un evento significativo che non è detto si realizzi, è quella digitale. La posizione centrale dell’uomo in questo ambito è stata determinata dal fatto che la nostra intelligenza e capacità di ragionamento non potesse mai essere superata. Ma ci siamo decentralizzati anche da questa primarietà.

«Turing ci ha deposto dalla posizione privilegiata ed esclusiva che avevamo nel regno del ragionamento logico, della capacità di processare informazioni e di agire in modo intelligente. Non siamo più gli indiscussi padroni dell’infosfera. I nostri dispositivi digitali svolgono un numero crescente di compiti che richiederebbero da parte nostra una certa attività intellettuale se ci fossero affidati».[3]

Se consideriamo le aspettative sull’intelligenza artificiale e le varie ipotesi distopiche formulate a riguardo, è chiaro come la nostra immaginazione si sia lasciata andare, inghiottita all’interno di un universo fantascientifico. Non è assolutamente un male, ma dobbiamo confrontarci con la realtà: la trasformazione che stiamo vivendo non è da considerarsi dal punto di vista biotecnologico all’interno del nostro corpo, quanto piuttosto come la trasformazione dell’ambiente in cui viviamo e delle varie implicazioni che ne derivano.

© Cpyright. Estratto dalla tesi di Laurea in Filosofia, Teorie e sistemi dell’intelligenza artificiale, a cura di Federico Malpighi. Alma Mater Studiorum Università di Bologna. Materiale pubblicato per fini didattici e di ricerca con il permesso dell’autore. Riproducibile solo con citazione della fonte originale.


[1] Luciano Floridi, La quarta rivoluzione. Come l’infosfera sta trasformando il mondo, Raffaello Cortina Editore, 2014, p. 72.

[2] Luciano Floridi, La quarta rivoluzione. Come l’infosfera sta trasformando il mondo, Raffaello Cortina Editore, 2014, p. 101.

[3] Luciano Floridi, La quarta rivoluzione. Come l’infosfera sta trasformando il mondo, Raffaello Cortina Editore, 2014, p. 105.

Quale futuro per la nostra salute ?

In un recente articolo pubblicato dal The Journal of AMD, intitolato Intelligenza Artificiale e Big Data in ambito medico: prospettive, opportunità, criticità. JAMD Vol. 21-3, Nicoletta Musacchio e i suoi collaboratori hanno evidenziato l’evoluzione e l’incredibile aumento delle informazioni digitali, raddoppiate in quasi ogni ambito negli ultimi 2 anni.

Conseguentemente a questo aumento, siamo arrivati ad avere una mole non indifferente di dati, che sono stati definiti come Big Data. Essi sono caratterizzati da quattro componenti, rappresentate dalla lettera “V”: volume, velocità, varietà ed infine veridicità. I Big Data li troviamo oggigiorno anche in ambito medico sanitario, grazie allo sviluppo di quattro differenti fenomeni.

In primis lo sviluppo della diagnostica per immagini digitali, che sta prendendo il posto alle antiquate tecniche di diagnostica analogica. Collegato a ciò, ci sono ovviamente le nuove tecniche di reportistica digitale: tutti noi disponiamo di cartelle e fascicoli elettronici sanitari su cui vengono pubblicati gli esiti delle visite mediche a cui ci sottoponiamo.

Gli altri due punti riguardano temi differenti: lo sviluppo delle biotecnologie impiegate nelle scienze riguardanti la genomica e la trascrittomica; e l’esplosione di quello che viene definito come “Internet of things” (IOT). Il primo di questi due fenomeni riguarda l’indagine che viene effettuata sulle cellule ad un livello sempre più microscopico: l’analisi di ciò e l’elaborazione dei dati ricavati portano alla creazione di un ingente mole di dati.

Infine, l’esplosione delle IOT riguarda l’evoluzione tecnologica che stiamo vivendo ad un livello molto più ampio rispetto al solo settore della sanità (sia essa pubblica o privata). Passare dall’IOT al IOMT (ovvero l’Internet of medical things) è un passo molto più breve di quanto si pensi: basti pensare ai moderni orologi da polso, in grado di tenere conto dei battiti cardiaci, della temperatura corporea e dei movimenti che compiamo in ogni singolo istante.

La vera rivoluzione in ambito di intelligenza artificiale applicata in ambito medico è e sarà sempre di più il machine learning: la capacità di un software di simulare ragionamenti sulla base dei dati forniti permetterà la generazione di modelli predittivi. Tali modelli tramite l’utilizzo di dati storici potranno prevedere eventi futuri (come l’insorgere di malattie). Esistono due differenti modelli: quelli trasparenti e quelli denominati “black box”.

I primi hanno la caratteristica di evidenziare i parametri su cui basano la loro previsione, passando così dall’essere predittivi a “prescrittivi”. Il modello “black box”, a contrario, ci fornisce sì una risposta ma non ci fornisce alcuna giustificazione a riguardo. Questa è una delle criticità legate all’utilizzo dell’intelligenza artificiale in ambito medico: affinché il sistema possa funzionare correttamente dobbiamo disporre di requisiti fondamentali come la qualità, la validità e il corretto utilizzo dei dati a nostra disposizione.

Alcuni di essi provengono da piattaforme che originariamente erano state dedicate a ben altri scopi. Sempre rimanendo in tema di dati, l’importanza fondamentale è che siano digitalizzati: negli archivi sono presenti ancora decine di migliaia di cartelle cliniche inutilizzate a questi scopi.

Ovviamente raccogliere ingenti quantità di informazioni cartacee e racchiuderle in un database è un lavoro molto impegnativo, che deve garantire anche la privacy delle persone interessate. È chiaro ora come l’intelligenza artificiale possa essere di estremo aiuto per le funzioni quotidiane e per l’implementazione di nuovi sistemi sanitari complessi, tuttavia affinché essa possa davvero essere efficiente, è necessario preparare una base solida su cui poter erigere un sistema di tale complessità.

© Cpyright. Estratto dalla tesi di Laurea in Filosofia, Teorie e sistemi dell’intelligenza artificiale, a cura di Federico Malpighi. Alma Mater Studiorum Università di Bologna. Materiale pubblicato per fini didattici e di ricerca con il permesso dell’autore. Riproducibile solo con citazione della fonte originale.

Riflessioni sull’etica delle macchine

Questi sette punti sono stati stilati sulla base di tre diversi presupposti che una qualsiasi intelligenza artificiale deve possedere: legalità, eticità e robustezza. Legalità significa che deve attenersi alle regole e alle leggi presenti e future.

Eticità che deve fare riferimento a principi etici e morali in accordo con quelle che sono gli obiettivi di coesione sociale ed integrazione promulgati dalla comunità europea. Infine, la robustezza sia tecnica che sociale, che renderà l’intero sistema uno strumento sicuro da utilizzare (sistemi di intelligenza artificiale potrebbero causare gravi danni seppur non intenzionali).

I sette punti elencati non devono essere visti come delle regole fisse a cui ogni macchina deve attenersi, quanto piuttosto una linea guida da seguire per la creazione di una legislazione che possa essere usufruibile in futuro[1].

  • Azione e sorveglianza umane: i sistemi di IA dovrebbero promuovere lo sviluppo di società eque sostenendo l’azione umana e i diritti fondamentali e non dovrebbero ridurre, limitare o sviare l’autonomia dell’uomo.
  • Robustezza e sicurezza: per un’IA di cui ci si possa fidare è indispensabile che gli algoritmi siano sicuri, affidabili e sufficientemente robusti da far fronte a errori o incongruenze durante tutte le fasi del ciclo di vita dei sistemi di IA.
  • Riservatezza e governance dei dati: i cittadini dovrebbero avere il pieno controllo dei propri dati personali e nel contempo i dati che li riguardano non dovranno essere utilizzati per danneggiarli o discriminarli.
  • Trasparenza: dovrebbe essere garantita la tracciabilità dei sistemi di IA.
  • Diversità, non discriminazione ed equità: i sistemi di IA dovrebbero tenere in considerazione l’intera gamma delle capacità, delle competenze e dei bisogni umani ed essere accessibili.
  • Benessere sociale e ambientale: i sistemi di IA dovrebbero essere utilizzati per promuovere i cambiamenti sociali positivi e accrescere la sostenibilità e la responsabilità ecologica.
  • Responsabilità intesa anche come accountability: dovrebbero essere previsti meccanismi che garantiscano la responsabilità e l’accountability dei sistemi di IA e dei loro risultati.

Un’intelligenza artificiale accuratamente programmata secondo queste “leggi” sarebbe un grosso passo in avanti per l’uomo, oltre che ad un supporto alla società ineguagliabile.

L’aiuto che può essere offerto riguarderebbe le più svariate forme: dalla medicina, all’ambiente, passando per l’organizzazione delle città (le cosiddette smart cities) e il mondo del lavoro. Esaminiamo ora alcune di queste questioni.

© Cpyright. Estratto dalla tesi di Laurea in Filosofia, Teorie e sistemi dell’intelligenza artificiale, a cura di Federico Malpighi. Alma Mater Studiorum Università di Bologna. Materiale pubblicato per fini didattici e di ricerca con il permesso dell’autore. Riproducibile solo con citazione della fonte originale.


[1] https://ec.europa.eu/digital-single-market/en/news/ethics-guidelines-trustworthy-ai, URL consultato in data 28 agosto 2020.

La legge dei ritorni accelerati

Abbiamo visto precedentemente come la Legge di Moore definisca una curva esponenziale di sviluppo ma ciò rappresenti solamente un caso particolare di una legge più generale: la legge dei ritorni accelerati. Tale legge afferma come la curva descritta dalla prima legge di Moore in realtà sia doppiamente esponenziale. Questo significa che a mano a mano che il nostro progresso tecnologico avanzerà, diminuirà anche il tempo per nuove scoperte.

Quanto detto è stato espresso da Ray Kurzweil in The Law of Accelerating Returns[1]. L’adozione di una nuova tecnologia da parte dell’essere umano determina, all’interno del grafico dello sviluppo, un gradino, su cui si ergerà un’ennesima curva esponenziale. Analizzando quest’ultimo grafico ed estrapolando la velocità d’evoluzione attuale, potremmo iniziare a considerare cosa potrebbe aspettarci da qui a dieci o cento anni a questa parte. Ray Kurzweil ha proposto sei diverse epoche[2], basandosi su quali invenzioni sono state fatte nell’epoca precedente per ipotizzare (o confermare) cosa è stato creato nell’epoca successiva.

Le sei epoche di Kurzweil

La prima epoca è determinata da una massa di informazioni semplice e generale: energia e materia. Si parla di milioni di anni fa, in cui erano presenti strutture atomiche che immagazzinavano informazioni di vario tipo. Dopo il Big Bang (milioni di anni dopo) gli atomi hanno iniziato a formarsi e successivamente è nata la chimica: dall’incontro di atomi, sono nate le molecole. Doveroso menzionare il carbonio, che grazie alle sue caratteristiche atomiche e molecolari, è in grado di combinarsi con altre molecole creando così strutture complesse tridimensionali.

La seconda epoca è invece caratterizzata dallo sviluppo di organismi a partire dal carbonio: il DNA è l’apice di sviluppo di questa epoca, permettendo di trasmettere un numero informazioni sempre maggiore. La terza epoca, seguendo il meccanismo delle precedenti, parte dal DNA per arrivare allo sviluppo di organismi complessi, dotati di organi sensoriali e capacità di memorizzazione delle informazioni raccolta dai sensi stessi: si ha così lo sviluppo di cervelli e sistemi nervosi.

Questa ultima fase ha avuto inizio quando ha avuto inizio, da parte degli organismi, il pattern recognition, ovvero il riconoscimento degli “oggetti” nell’ambiente circostante. Tra tutti gli organismi, l’essere umano è riuscito a compiere dei ragionamenti logico-razionali su ciò che lo circonda, ed applicare in futuro tali pensieri. La quarta epoca si differenzia dalle altre dal momento che il progresso biologico è terminato ed è arrivato al culmine con l’uomo.

D’ora in avanti lo sviluppo riguarderà principalmente la tecnologia: da piccoli e semplici congegni meccanici siamo arrivati oggi a sofisticate apparecchiature elettroniche in grado di gestire e memorizzare una quantità impressionante di dati. Volendo paragonare lo sviluppo biologico e quello “tecnico”, è chiaro come il secondo sia avvenuto in maniera rapida e veloce: sono passati due miliardi di anni circa dall’origine della vita alle cellule, solamente quattordici anni dal primo computer portatile al World Wide Web.

La quinta epoca dovrebbe essere orientata indicativamente da oggi ad un futuro prossimo ed all’interno di essa avremmo la cosiddetta “fusione” tra l’intelletto umano e la tecnologia. Avverrà l’unione definitiva uomo-macchina, la singolarità tecnologica, come è stato spesso raccontato in molte pellicole cinematografiche e romanzi. Questo ci permetterà di ampliare gli orizzonti sia intellettuali che tecnologici, superando così i limiti imposti dal nostro sistema biologico.

Infine, l’ultima epoca delle sei descritte da Kurzweil, prevede un ulteriore evoluzione che permetterà sulla base delle tecnologie della singolarità tecnologica di superare i limiti dell’universo per come è conosciuto oggigiorno. Saremo in grado di trasformare l’intero universo in un complesso sistema intelligente. Sulla base della divisione proposta da Ray Kurzweil è interessante l’argomento portato dall’astronomo russo  Nikolaj Kardašëv, per la classificazione della civiltà umana sulla base della tecnologia che è in grado di produrre.

3.2.1 La scala di Kardashev

Tale scala è divisa in tre diversi tipi, sulla base dell’energia che l’uomo è in grado di produrre nell’ordine dei Watt; ed è utilizzata come base di partenza per il progetto SETI, volto alla ricerca di forme di vita extra terrestre. Una civiltà di tipo I sarebbe in grado di utilizzare tutta l’energia proveniente dal pianeta d’origine (nell’ordine dei 4×1016 watt), una civiltà di tipo II riuscirebbe ad usufruire di tutta l’energia di un intero sistema solare (4×1026 watt), infine una civiltà di tipo III capace di usare tutta l’energia presente all’interno della galassia in cui risiede (4×1036 watt).

Carl Sagan, astronomo e divulgatore scientifico, ha applicato una formula per poter calcolare a che livello si trovi la civiltà umana: ovviamente non siamo ancora una civiltà di primo livello, ma ci siamo molto vicini considerando che il valore corrisponde a 0,75! Magari arrivati al tipo I saremo in grado di usufruire di tecnologie tali da espandere esponenzialmente le nostre capacità, sia all’interno del sistema solare, sia all’interno della Via Lattea.

Iosif Šklovskij, uno dei principali collaboratori di Kardashev, ha affermato, come riportato da Ray Kurzweil in “la singolarità è vicina[3] che è impossibile non aver incontrato nel corso del progetto SETI una qualsiasi civiltà di tipo II o tipo III. Questo viene anche definito come il paradosso di Fermi, attribuito al fisico italiano Enrico Fermi: «Se l’Universo e la nostra galassia pullulano di civiltà sviluppate, dove sono tutte quante?».

© Cpyright. Estratto dalla tesi di Laurea in Filosofia, Teorie e sistemi dell’intelligenza artificiale, a cura di Federico Malpighi. Alma Mater Studiorum Università di Bologna. Materiale pubblicato per fini didattici e di ricerca con il permesso dell’autore. Riproducibile solo con citazione della fonte originale.


[1] Ray Kurzweil, The Law of Accelerating Returns, su kurzweilai.net, 7 marzo 2001. URL consultato in data 20 agosto 2020.

[2] Ray Kurzweil, The Law of Accelerating Returns, su kurzweilai.net, 7 marzo 2001. URL consultato in data 20 agosto 2020.

[3] Ray Kurzweil, La singolarità è vicina, Apogeo Education, 2005, p.608.

Tra artificiale e biologico

Questa metodologia di apprendimento cerca di creare un modello automatico su più livelli, in cui i livelli più “profondi” prendano in input i dati provenienti dai livelli precedenti a loro, rielaborandoli.

Ogni livello della scala di cui si compone corrisponderebbe ad una delle diverse aree che compongono il cervello umano, ognuna con le proprie caratteristiche: in base agli stimoli provenienti dall’esterno, così come nel cervello vengono “attivati” nuovi neuroni, così nella struttura proposta dal deep, verranno proposte differenti risposte del sistema a seconda degli stimoli ricevuti.

Nell’ambito delle reti neurali artificiali il deep learning viene largamente usato: si cerca di riprodurre il calcolatore più complesso in assoluto, il cervello umano. Le differenze tra i due sistemi sono ancora molto evidenti, basti pensare che a noi “umani” per riconoscere il viso familiare in una folla di persone possono volerci alcuni secondi, per una macchina distinguere immagini ben più semplici addirittura giorni!

Ed è così anche nel mondo animale, se consideriamo che i sistemi di orientamento di un pipistrello sono ben più avanzati e sviluppati dei sistemi radar umani. Questi paragoni servono principalmente per comprendere la difficoltà della risposta che vogliamo ottenere, e anche le complicazioni che sussistono all’interno di questo ambito di riserva. Ma che cos’è una rete neurale?

Per rete neurale intendiamo un processore ispirato al funzionamento del sistema nervoso di organismo biologici complessi, costituito di unità computazionali elementari che giocano lo stesso ruolo dei neuroni nel cervello. Essi hanno due caratteristiche: la prima è la conoscenza, come abbiamo visto precedentemente, acquisita tramite processi di apprendimento.

La seconda consiste nella capacità di immagazzinare tali conoscenze all’interno del sistema neuroni-rete neurale. I neuroni artificiali funzionano come nodi all’interno della rete, ricevono segnali provenienti dall’esterno o da altri nodi (neuroni) e ne effettuano una trasformazione chiamata funzione di attivazione. Questa operazione altro non fa che trasformare matematicamente il valore delle informazioni prima di passarle ad uno strato successivo, facendo in modo di trasmettere i valori di input attraverso tutta la rete fino ad arrivare all’output.

Il percettone è stato il primo schema di rete neurale proposta da Frank Roosenbalt nel 1958. Esso si presentava come un semplice classificatore binario in grado di riconoscere due differenti classi di input e separarle. Strutturalmente le similitudini con un neurone biologico sono indiscutibili: i dendriti e le sinapsi costituiscono l’input del neurone, mentre il nucleo e gli assoni costituiscono l’output del neurone che andrà poi ad interagire con gli altri neuroni. Il problema riguardante questo primo esperimento è la grande limitazione computazionale del singolo percettone, collegata al fatto che le prestazioni ottenibili dipendono con la scelta degli input.

Dal 1958 ad oggi, con un’impennata raggiunta negli anni ‘80, lo sviluppo delle reti neurali è continuato ed è possibile impiegare tali tecnologie soprattutto quando la difficoltà computazionale aumenta e le quantità di dati da elaborare diventano proibitive per l’uomo: ad esempio vengono utilizzate nel controllo del traffico aereo e veicoli, nelle simulazioni videoludiche come il gioco degli scacchi, nel riconoscimento nei sistemi radar e di identificazione facciale e vocale.

La nota negativa riguardante l’utilizzo di tali sistemi riguarda il fatto che, a differenza di sistemi algoritmici nei quali è possibile analizzare l’intero processo di elaborazione, con le reti neurali ci viene fornito solamente un dato (o un insieme di dati) in output che dobbiamo prendere come tale. Per questo a maggior ragione la scelta dei dati in ingresso è fondamentale per una corretta e attendibile valutazione da parte della rete.

Come abbiamo visto sussistono ancora innumerevoli differenze tra la tecnologia utilizzabile in ambito di reti neurali e le reti neurali biologiche presenti all’interno del cervello: tuttavia, le similitudini tra questi sistemi non sono così astratte. Le diverse tipologie di apprendimento automatico che abbiamo tenuto in considerazione mostrano come l’uomo stia cercando di ricreare artificialmente quello che possiede biologicamente: ovviamente non è un’operazione semplice, ma le possibilità di sviluppo sono a favore dei ricercatori.

Da un punto di vista computazionale e di velocità di elaborazione dei dati, una macchina sarà sempre favorita sull’uomo, rimane da implementare la parte relativa all’intenzionalità e alla cognizione. E nonostante ammettessimo che un’intelligenza artificiale (di tipo simbolico) possa essere associata al concetto di intenzionalità,  nulla ci garantisce che essa possa possedere autocoscienza di sé.

Se così fosse avremo di fronte a noi qualcosa di rivoluzionario: sarebbe una tecnologia tale da potersi migliorare da sola, rendersi conto di sé e di cosa la circonda, delle minacce e dei pericoli. In questo caso ci troveremo di fronte a quella che Nick Bostrom ha catalogato come Superintelligenza e che esporrò nel terzo capitolo.

Il machine learning è un tipo di apprendimento che riguarda l’intelligenza artificiale e ricopre un ruolo centrale nello sviluppo di quest’ultima: apprendere significa conoscere maggiormente, e questo significa svilupparsi meglio e più velocemente. Il procedimento di apprendimento risulta simile a quello dell’uomo sotto certi punti di vista: alla macchina viene programmata con un algoritmo tale da cercare e analizzare determinate informazioni. Come se stessimo insegnando a leggere a qualcuno: prima impara a leggere, poi imparare a rielaborare i dati e le informazioni ricevute. Può sembrare un discorso astratto, che riguarda tecnologie lontane dall’uso quotidiano ma non è assolutamente così, dato che praticamente ogni applicazione presente nei nostri smartphone (o per lo meno le più rinomate) utilizza algoritmi di apprendimento. Il machine learning viene utilizzato da Google e Amazon (solo per citarne alcuni tra i più importanti) per la gestione e l’analisi dei dati, o pattern, per essere più corretti. La traduzione di pattern sarebbe “forma” o “modello” ma secondo Satoshi Watanabe[1] va definito come un’entità specifica a cui è possibile fornire un nome, contrapposto a un’entità generica. Questi dati vengono trattati secondo differenti approcci, proposti da Arthur Samuels[2] negli anni ‘50 che sono: l’apprendimento supervisionato, l’apprendimento non supervisionato ed infine l’apprendimento per rinforzo.

2.3.1 Apprendimento supervisionato

Questa tecnica consiste in due fasi: training e prediction. Durante la fase di training la macchina viene istruita con dei dati in input ideali (come se fossero degli esempi da seguire). Successivamente entriamo nella seconda fase, quella del prediction: a questo punto la macchina utilizza il modello ideale precedentemente usato per rielaborare nuovi dati e produrre un output. Questo tipo di apprendimento è spesso usato nell’ambito del marketing: la sua applicazione permette di classificare i potenziali clienti e di proporgli determinati articoli in base alla loro cronologia di acquisti. Inoltre, viene utilizzato anche all’interno delle caselle di posta elettronica per categorizzare le e-mail a seconda che siano “spam” oppure no.

2.3.2 Apprendimento non supervisionato

L’apprendimento non supervisionato serve principalmente ad ottenere nuove informazioni. L’applicazione principale è il “clustering” ovvero il raggruppamento di determinati dati in gruppi omogenei che prendono appunto il nome di “cluster”. Utile in ambito di analisi di mercato per l’individuazione di nuovi clienti e nuovi mercati, è spesso utilizzato in ambito di Big-Data come un motore di ricerca: tramite una o poche parole questo algoritmo è in grado di creare molteplici collegamenti (link) attinenti alla ricerca iniziale. Interessante come nel 1975 Kunihiko Fukushima pubblicò una rete neurale non supervisionata finalizzata al riconoscimento di “pattern” che prendeva il nome di Cognitrone. Si caratterizza per organizzare autonomamente i collegamenti sinaptici tra i propri neuroni e quindi apprendere senza la supervisione di un insegnante. Nel modello proposto sono presenti quattro differenti strati denominati U0, U1, U2, e U3: il primo strato (U0) corrisponde ai neuroni presenti nella retina, mentre l’ultimo strato (U3) corrisponde ai neuroni presenti nella corteccia celebrale. Tale modello prende in considerazione del numero finito di dendriti presenti nei neuroni biologici e della lunghezza dell’assone: questi limiti permettono di associare i neuroni di ogni livello ad altri di un livello superiore, creando così una rete neurale intimamente connessa.

2.3.3 Apprendimento di rinforzo

Questo tipo di apprendimento è largamente usato in ambito robotico e si occupa di risolvere problemi di decisioni sequenziali. La macchina risponde a cambiamenti dell’ambiente circostante e per questo motivo è privilegiato in ambito robotico, ad esempio, nella gestione degli automi, ma anche nella guida senza conducente (driverless car). L’apprendimento per rinforzo funziona mediante tre diverse fasi: la prima consiste nell’applicazione di un algoritmo per cui in base ad un input viene generato un output. La seconda fase consiste nella valutazione dell’output precedentemente ottenuto: se è soddisfacente verrà rilasciata un giudizio positivo, al contrario verrà penalizzata. Infine, è presente un sistema di controllo che monitora l’operato delle prime due fasi, e modifica l’algoritmo utilizzato da A per fare in modo che il premio aumenti e le penalità diminuiscano, migliorando così l’intero processo.

Estratto dalla tesi di Laurea in Filosofia, Teorie e sistemi dell’intelligenza artificiale, a cura di Federico Malpighi. Alma Mater Studiorum Università di Bologna.


[1] Satosi Watanabe. 1985. Pattern recognition: human and mechanical. John Wiley & Sons, Inc., USA.

[2] A. L. Samuel, “Some studies in machine learning using the game of checkers“, in IBM Journal of Research and Development, vol. 44, no. 1.2, pp. 206-226, Jan. 2000, doi: 10.1147/rd.441.0206.


Apprendimento non associativo

Questo tipo di apprendimento si divide in abitudine e sensibilizzazione. Nel presentare queste due diverse modalità di apprendimento farò uso di esempi pratici. Immaginiamoci una tartaruga che si muove tranquillamente nel suo giardino. Ad un tratto, colpiamo il terreno vicino ad essa con un oggetto e come immediata risposta notiamo come la tartaruga rientri all’interno del guscio. Se continuassimo a colpire vicino a lei, noteremo che a mano a mano che perpetuiamo il movimento, la sua risposta sarà di volta in volta più lenta. Questo comportamento rientra in quella che viene definita abituazione alla situazione. La sua funzione è quella di eliminare delle risposte non necessari a stimoli provenienti dall’esterno. L’effetto opposto all’abituazione è quello della sensibilizzazione: se invece di infastidire la tartaruga come avevamo descritto precedentemente, la sottoponessimo ad uno shock (come una scossa elettrica) ella si ritirerebbe nel guscio molto più velocemente a qualunque stimolo si presentasse nuovamente.

Apprendimento associativo

Apprendimento associativo classico

L’apprendimento associativo si divide in classico, operante e complesso. L’apprendimento associativo classico, chiamato anche condizionamento classico consiste in un processo in cui uno stimolo precedentemente neutrale si associa con un altro stimolo. Dopo svariate associazioni abbinate avverrà una produzione della stessa risposta del primo stimolo ricevuto. Ivan Petrovic Pavlov, premio Nobel per la medicina nel 1904, stava studiando la produzione di saliva nei cani in risposta a determinati stimoli. I cani, ovviamente, in presenza di cibo aumentavano la produzione di saliva. Pavlov decise così di associare alla presentazione del cibo, il suono di una campanella che configurerebbe come lo stimolo neutro. Dopo varie e successive associazioni di questo tipo, il cane iniziò il processo di salivazione al solo suono della campanella.

Apprendimento associativo operante

Passando all’apprendimento operante, questo si differenzia dal classico per via del fatto che si apprendono nuove risposte perché influenzano l’ambiente circostante. Questo modello di apprendimento si basa sul concetto di stimolo-risposta-conseguenza.  L’esempio più famoso è quello della puzzle box di Thorndike. Immaginiamoci una specie di gabbia in cui inseriamo un gatto (o un altro animale) all’interno: egli è libero di esplorarla, e può anche premere tasti o spostare delle leve. In generale l’apprendimento operante consiste nell’ agire tramite un comportamento bene preciso, che se ha un effetto positivo sulle nostre intenzioni verrà presentato con una frequenza maggiore.

Apprendimento associativo complesso

Quest’ultimo si basa su rappresentazioni mentali ben più complesse rispetto alle semplici associazioni che avvenivano precedentemente: stiamo parlando delle capacità di problem solving di un individuo, processi di decision making e concetti astratti come quello di causa. Wolfgang Köhler introdusse il concetto di “insight” osservando il comportamento degli scimpanzé di fronte a situazioni difficoltose, come ad esempio il dover arrampicarsi su una scatola per riuscire ad afferrare una banana. Di fronte a tali situazioni si rese conto che gli scimpanzé riuscivano a trovare una soluzione al problema in modo improvviso e non a fronte di errori ripetuti nel tempo. Köhler suggerisce che l’apprendimento per insight è composto da due fasi differenti: la prima è la capacità di risoluzione di un problema, la seconda è la memorizzazione della soluzione e l’applicazione della stessa in un’altra situazione. Konrad Lorenz ha definito un altro metodo di apprendimento chiamato “imprinting” che gli è valso il premio Nobel per la medicina e la fisiologia del 1973. Secondo la sua teoria, gli esseri viventi possiedono una capacità innata di apprendimento dall’essere biologico (una figura materna) su cui viene costruito un modello comportamentale istintivo. Questo è stato osservato da Lorenz stesso sui piccoli di oca: la figura con cui essi interagivano nelle prime 48 ore di vita, sarebbe diventata di riferimento, generando un imprinting e facendogli credere che sia la loro vera madre, a prescindere dalla specie di appartenenza (uomo o altro animale). L’imprinting è stato osservato anche nel genere umano da Renè Spitz e avviene nei primi nove mesi di vita di un bambino: nel caso venisse a mancare la formazione di questo tipo di legame, come è stato osservato da Spitz stesso, sorgerebbero problemi legati allo sviluppo e alla regolazione psicologica dell’individuo.

Gli esempi di apprendimento che ho riportato, facendo riferimento sia all’attività della mente, sia a quella “materiale” del cervello evidenziamo come l’intenzionalità e i processi cognitivi (tra cui l’apprendimento) negli uomini siano meccanismi che sorgono dalla continua interazione di componenti biologiche e condizioni culturali. Non esiste un solo modo di conoscere e imparare, così come non esiste un solo modo di comportarsi di fronte ad un’unica situazione. Di fronte ad un discorso del genere sembrerebbe che le macchine o intelligenze artificiali non siano coinvolte nei processi di apprendimento, relegando le stesse in una condizione di strumento che qualora voglia “arricchire” le proprie competenze deve fare affidamento sulle capacità di programmazione dell’uomo. Ma, seppur non siano in grado di compiere dei processi cognitivi e non siano dotate di intenzionalità, le intelligenze artificiali sono in grado di imparare.

Estratto dalla tesi di Laurea in Filosofia, Teorie e sistemi dell’intelligenza artificiale, a cura di Federico Malpighi. Alma Mater Studiorum Università di Bologna.

Il Test di Turing totale

Oltre alla versione della stanza cinese, nel corso degli anni sono state presentate altre diverse versioni del test. Una di questa è il test di Turing totale [1], proposto da Stevan Harnad: a differenza del test classico descritto precedentemente, questa variante include due supporti ulteriori: un segnale video per testare le capacità percettive ed un braccio robotico che permetta di manipolare degli oggetti.

Affinché la macchina super il test dovrà essere in grado, come nella precedente versione, di confondersi con un essere umano. Essendoci anche un contatto visivo e sensoriale, la difficoltà di passare l’esame aumenta notevolmente.

Il test di Turing è un ottimo punto di partenza per determinare il funzionamento più o meno corretto di un programma appositamente creato, ma non si può considerare come unico ostacolo da superare per determinare successivamente la presenza di un’intelligenza artificiale al pari dell’uomo.

Il premio Loebner

Negli anni sono stati istituiti premi e concorsi come ad esempio il Premio Loebner, una competizione che si basa sul test di Turing e che va a premiare l’intelligenza artificiale che più si avvicina a quella di un essere umano.

Si può menzionare ad esempio menzionare “Mitsuku”, una chatbot (ovvero un software progettato per simulare una conversazione con un essere umano) ideato da Steve Worswick che ha vinto ben cinque differenti edizioni della competizione.

Può giocare su richiesta dell’utente ed è in grado di ragionare su oggetti specifici: se gli chiedessimo “Puoi mangiare una casa?” questo programma ragionerebbe sulle proprietà degli oggetti: una casa è fatta di mattoni, essi non sono commestibili, di conseguenza non posso mangiare una casa.

Mitsuku è basato sulla tecnologia AIML (Artificial Intelligence Markup Language) un linguaggio di markup utile per creare applicazioni in grado di interagire con l’uomo in autonomia e facilmente implementabili e programmabili. Mitsuku non si basa sul “machine learning” (apprendimento automatico), è stato appositamente programmato e continua, dal 2005, ad essere sviluppato e ad interagire con milioni di persone ogni anno. Nonostante questo chatbot detenga il primato di vittorie, non possiamo affermare che abbia superato il test di Turing.

La mente umana non può quindi essere riprodotta solamente basandosi su elementi sintattici ma ancora non è possibile simularla completamente, includendo stati intenzionali e coscienziosi.


[1] Harnad, S. (1991), ‘Other Bodies, Other Minds: A Machine Incarnation of an Old Philosophical Problem’, Minds and Machines 1 pp. 43–54.


Dr. Daniele Trevisani - Formazione Aziendale, Ricerca, Coaching