Una rete neurale (in inglese “neural network”) è un sistema della tecnologia informatica che si ispira alla struttura del cervello umano e che permette ai computer di adottare caratteristiche dell’intelligenza artificiale. Le reti neurali sono un componente centrale e uno dei molti metodi offerti dalle moderne applicazioni di IA, ad esempio dai chatbot come ChatGPT.

Esistono diversi tipi di reti neurali artificiali, ciascuno dei quali offre diverse possibilità di elaborazione delle informazioni nell’ambito del deep learning. Negli ultimi anni, la ricerca in questo campo ha compiuto passi da gigante. Le reti neurali costituiscono quindi una tecnologia fondamentale per insegnare alle macchine a pensare autonomamente e permettono ai computer di risolvere i problemi in modo indipendente e migliorare le proprie capacità. Oggi le reti neurali fanno parte di sistemi multimodali in grado di combinare testi, immagini, audio e video.

Come funziona una rete neurale?

Le reti neurali si ispirano al funzionamento biologico del cervello umano, che elabora informazioni attraverso una rete di neuroni.

Le reti neurali artificiali possono essere descritte come modelli costituiti da almeno due strati, uno strato di ingresso e uno di uscita, e di solito anche da ulteriori strati intermedi (hidden layers). Le reti moderne, come le reti neurali convoluzionali (CNN, Convolutional Neural Network) o i modelli trasformatori necessitano spesso di un gran numero di strati anche per svolgere compiti semplici, perché la profondità contribuisce alla loro efficienza. Ogni strato della rete contiene un certo numero di neuroni artificiali specializzati.

I software IA di IONOS
Scopri la potenza dell'intelligenza artificiale
  • Siti web in tempo record
  • Soluzioni IA per il tuo business
  • Risparmio di tempo e risultati eccellenti

Elaborazione delle informazioni nella rete neurale

L’elaborazione delle informazioni nella rete neurale segue sempre la stessa procedura: le informazioni sotto forma di modelli o segnali sono trasferite ai neuroni dello strato di ingresso, dove sono elaborate. A ogni neurone è assegnato un peso, in modo che i neuroni ricevano un’importanza diversa. Il peso, insieme a una funzione di trasferimento, determina l’ingresso, dove quindi il neurone è inoltrato.

Nella fase successiva una funzione di attivazione e un valore di soglia calcolano e ponderano il valore di uscita del neurone. A seconda della valutazione delle informazioni e della ponderazione, altri neuroni sono collegati e attivati in misura maggiore o minore.

Per mezzo di questo collegamento e di questa ponderazione, viene modellato un algoritmo che produce un risultato per ogni ingresso. A ogni addestramento, la ponderazione e quindi l’algoritmo vengono modificati in modo che la rete fornisca risultati sempre più precisi e migliori.

Rete neurale: esempio di applicazione

Le reti neurali possono essere utilizzate per il riconoscimento delle immagini. A differenza degli esseri umani, un computer non è in grado di riconoscere se un’immagine raffigura un essere umano, una pianta o un oggetto, ma deve esaminare le caratteristiche individuali della figura. Il computer sa quali caratteristiche sono rilevanti grazie all’algoritmo implementato oppure può scoprirlo da solo attraverso l’analisi dei dati.

In ogni strato della rete il sistema controlla i segnali di ingresso, ossia le immagini, in base a criteri individuali come il colore, gli angoli e le forme. Dopo ogni controllo, il computer può valutare meglio ciò che è rappresentato nell’immagine.

Inizialmente, i risultati saranno soggetti a errori. Se la rete neurale riceve un feedback da un addestratore umano ed è in grado di modificare l’algoritmo, si parla di apprendimento automatico. Nel deep learning l’addestramento umano può essere omesso. In questo caso il sistema impara dalla propria esperienza e diventa tanto migliore quanto più materiale visivo ha a disposizione.

Idealmente, il risultato finale è un algoritmo in grado di identificare il contenuto delle immagini senza errori: a seconda dell’addestramento, indipendentemente dal fatto che queste immagini siano in bianco e nero o in una determinata posa o prospettiva.

Tipi di reti neurali

Sono utilizzate diverse strutture di reti neurali a seconda del metodo di apprendimento usato e dello scopo dell’applicazione.

Percettrone

La forma più semplice della rete neurale designava in origine una “rete” costituita da un singolo neurone, alterato da ponderazioni e da un valore di soglia. Nel frattempo il termine percettrone è usato anche per indicare il modello più semplice di reti feed forward.

Reti feed forward

Queste reti neurali artificiali possono condurre le informazioni in una sola direzione di elaborazione. Le reti possono essere monostrato, ossia costituite solo da livelli di ingresso e di uscita, o multistrato con vari strati nascosti (in inglese, “hidden layer”).

N.B.

Troverai maggiori informazioni sulle reti feed forward nella nostra guida.

Reti ricorrenti

Nelle reti ricorrenti i valori di uscita di uno strato di un livello superiore vengono utilizzati come ingresso a uno strato di livello inferiore. Queste interconnessioni tra strati consentono al sistema di creare una memoria. Le reti ricorrenti sono utilizzate, ad esempio, nel riconoscimento vocale, nella traduzione e nel riconoscimento della grafia.

N.B.

Maggiori dettagli sull’argomento sono disponibili nella nostra guida dedicata alle reti neurali ricorrenti.

Reti neurali convoluzionali

Queste reti sono un sottoinsieme delle reti multistrato. Sono costituite da almeno cinque strati. Il riconoscimento dei modelli è eseguito su ogni strato, dove il risultato di uno strato è trasferito a quello successivo. Questo tipo di rete neurale è utilizzato per il riconoscimento delle immagini.

N.B.

Nella nostra guida sulle reti neurali convoluzionali trovi informazioni più dettagliate sull’argomento.

Metodo di apprendimento

Affinché le connessioni nelle reti neurali artificiali siano stabilite correttamente per svolgere la loro funzione, le reti devono prima essere addestrate. A tal proposito, si possono distinguere due metodi fondamentali:

Apprendimento supervisionato

Durante l’apprendimento supervisionato si definisce un risultato concreto per diverse opzioni di input. Se, ad esempio, le immagini dei gatti devono essere riconosciute come tali dal sistema, le persone controllano il riconoscimento del sistema e danno un feedback su quale immagine è stata riconosciuta correttamente e quale in modo errato. In questo modo si modificano i pesi nella rete e si ottimizza l’algoritmo.

Apprendimento non supervisionato

Nell’apprendimento non supervisionato il risultato dell’attività non è specificato. Il sistema impara esclusivamente sulla base delle informazioni in ingresso. A questo scopo sono utilizzate la regola di apprendimento di Hebb o la teoria della risonanza adattiva. Oggi nella pratica ci si concentra su algoritmi come la discesa del gradiente stocastico (SGD).

Aree di applicazione delle reti neurali

Le reti neurali possono essere utilizzate con successo soprattutto se è disponibile una grande quantità di dati da valutare e solo una scarsa conoscenza sistematica della soluzione. I casi di applicazione classici sono il riconoscimento di testo, immagini e voce, casi in cui i computer esaminano i dati per determinate caratteristiche al fine di effettuare un’assegnazione.

Le reti neurali come le reti neurali convoluzionali (CNN) permettono ai computer di riconoscere i contenuti nelle immagini. Questa tecnologia è utilizzata nell’analisi per immagini in medicina oppure per il controllo automatizzato della qualità in ambito industriale. In questi settori, le reti neurali sono utilizzate talvolta nella tecnologia di regolazione per monitorare i valori di riferimento e adottare automaticamente le contromisure in caso di scostamenti oppure per definire autonomamente i valori di riferimento sulla base della loro analisi dei dati.

I modelli linguistici come ChatGPT, che si basano sulle reti neurali, generano testi che suonano realistici, rispondono a domande oppure analizzano grandi quantità di dati testuali.

Le reti neurali artificiali possono essere utilizzate anche per fare previsioni e simulazioni, ad esempio nelle previsioni del tempo o nella diagnostica medica. Per esempio, le reti neurali convoluzionali (CNN) permettono ai computer di riconoscere contenuti nelle immagini. Questa tecnologia è utilizzata nell’analisi per immagini in ambito medico, ad esempio per identificare i tumori nelle immagini a raggi X.

Gli sviluppi nel campo dell’apprendimento non supervisionato delle reti neurali artificiali stanno ampliando notevolmente il campo di applicazione e le prestazioni delle reti. Tra le applicazioni più importanti delle reti neurali di autoapprendimento citiamo la sintesi vocale degli assistenti vocali. I sistemi comeAlexa, Siri e l’assistente Google sfruttano le reti neurali per convertire il linguaggio parlato in testi scritti e reagire ai testi stessi. I modelli trasformatori come GPT o BERT hanno rivoluzionato la qualità delle traduzioni automatiche.

Storia e prospettive future

Negli ultimi dieci anni la conoscenza delle reti neurali si è ampiamente diffusa nell’ambito del dibattito sull’intelligenza artificiale, ma della tecnologia in sé si è parlato già molti decenni prima.

Le considerazioni sulle reti neurali artificiali risalgono infatti ai primi anni ‘40. Warren McCulloch e Walter Pitts avevano già descritto un modello che collegava le unità elementari e che si basava sulla struttura del cervello umano, in grado in questo modo di calcolare quasi tutte le funzioni aritmetiche. Nel 1949 Donald Hebb ha sviluppato la regola di apprendimento sopra menzionata, ancora oggi applicata in molte reti neurali.

Nel 1960 è stata sviluppata una rete neurale che ha trovato un’applicazione commerciale a livello mondiale nel filtraggio dell’eco nei telefoni analogici. In seguito, la ricerca in questo settore si è fermata; da un lato, perché gli scienziati hanno concluso che il modello di rete neurale non poteva risolvere problemi importanti; dall’altro, perché l’apprendimento efficace dei sistemi richiedeva grandi quantità di dati digitali che all’epoca non erano disponibili.

La situazione è cambiata solo con l’avvento dei Big Data . Con l’introduzione dell’algoritmo di retropropagazione (in inglese, “backpropagation”) è diventato possibile addestrare reti multistrato, ponendo la base per i moderni modelli di deep learning. La combinazione tra enormi quantità di dati e la potenza di calcolo dei moderni processori grafici (GPU) ha portato a un enorme balzo in avanti negli anni 2010. I framework come TensorFlow e PyTorch hanno reso più accessibile lo sviluppo di reti neurali.

L’interesse per l’intelligenza artificiale era tornato e la vittoria di una CNN nel concorso ImageNet del 2012 ha segnato la nascita del moderno deep learning. Da allora, la tecnologia ha guadagnato importanza in tempi brevissimi e ha effetti su praticamente ogni campo dell’informatica.

Da quel momento, lo sviluppo in questo settore è progredito rapidamente. Per quanto promettenti possano essere i risultati, le reti neurali non sono l’unica tecnologia per implementare l’intelligenza artificiale nei computer, ma solo una possibilità, anche se spesso sono presentate nel dibattito pubblico come l’unica via percorribile. Oggi la ricerca va oltre le classiche reti neurali. L’attenzione è rivolta verso i modelli multimodali, che combinano testo, immagini e parlato, e sugli approcci alla riduzione del consumo energetico. Al tempo stesso, le reti neurali si stanno integrando sempre più nelle applicazioni quotidiane, dagli smartphone agli elettrodomestici intelligenti.

Hai trovato questo articolo utile?
Vai al menu principale