Come imparare la matematica necessaria all’analisi dati?

Un perito informatico, un ingegnere informatico o un informatico “puro” possono convertirsi al mondo dal data engineering.
Possono farlo anche persone che provengono da ambiti totalmente diversi, a patto di studiare le regole fondamentali della materia. Però serve una buona dose di conoscenza matematica, necessaria per analizzare i dati con cognizione di causa e per mettere a terra i ragionamenti corretti. Certo, spesso aziende diverse si ritrovano ad avere problemi simili e non è necessario creare delle nuove architetture da zero. In ogni caso il data engineer che conosce come funziona il meccanismo è enormemente avvantaggiato sul mercato, oltre che più versatile in ruoli e progetti diversi.
In questo articolo ti segnalo 5 risorse gratuite per imparare la matematica necessaria all’analisi dati.
5 strumenti gratuiti per imparare la matematica necessaria all’analisi dati
Come premessa, vorrei dire che qui parlerò più di corsi e strumenti utili a fornirti degli strumenti e dei concetti, più che a insegnarti l’abilità di calcolo. Infatti, del calcolo se ne possono facilmente occupare dei computer in modo molto più preciso di noi.
Però ad esempio alcuni concetti come la discesa del gradiente per trovare i valori di pendenza nei modelli di regressione lineare.
Poi, alcune tecniche di manipolazione delle matrici ti saranno utili se vuoi cimentarti nel deep learning.
Infine, anche la statistica torna utile per le analisi più complesse, che partono da un’ipotesi e che prevedono di saper interrogare i dati in una certa maniera.
Questi 5 strumenti, lo ribadisco, sono del tutto gratuiti e soddisfano diversi livelli di esperienza di chi si occupa di machine learning.
1) Serie di algebra lineare di 3Blue1Brown
3Blue1Brown è un canale YouTube che spiega concetti matematici anche complessi in modo molto chiaro.
L’aspetto migliore è che c’è molto concetto e poco calcolo. L’obiettivo di questa serie è quello di fornire una comprensione intuitiva dell’algebra lineare. Invece di memorizzare semplicemente le formule, potrai capire il loro funzionamento, e questo ti consentirà di crearle in autonomia.
2) Serie 3Blue1Brown’s Calculus Series
Se invece vuoi arrivare a un livello di calcolo migliore, c’è questa seconda risorsa sempre dello stesso canale che aiuta molto a capire alcuni elementi utili nell’implementazione dell’algoritmo di discesa del gradiente. Dello stesso gruppo abbiamo anche un buon programma di Deep Learning, più incentrato su chi studia l’intelligenza artificiale.
3) 3Blue1Brown’s Deep Learning Series
Mentre la loro serie di calcolo è più generale e si rivolge a chiunque desideri migliorare le proprie conoscenze in matematica, la serie di deep learning di 3Blue1Brown è stata creata appositamente per gli studenti interessati all’intelligenza artificiale.
La serie di deep learning ti guiderà attraverso il funzionamento interno di una rete neurale e come questi modelli sono in grado di apprendere schemi dai dati.
Ti verrà fornita una spiegazione approfondita dell’algoritmo di backpropagation e di come funziona, insieme ai concetti di calcolo alla base di esso.
4) Introduzione all’apprendimento statistico
Ottimo libro se vuoi iniziare ad avvicinarti al machine learning, questo testo è disponibile online e può essere scaricato gratuitamente in lingua inglese. Oltre alla parte teorica, nel manuale abbiamo anche alla fine di ogni capitolo un serie di esercizi in R.
Qui si parla di alberi decisionali, regressione lineare, regressione logistica e quando usarli per rispondere a determinate necessità. Insieme a questi, si acquisisce una comprensione intuitiva del funzionamento dei modelli lineari, degli algoritmi ad albero e delle tecniche non supervisionate.
È un manuale particolarmente utile se vuoi capire come evitare il temuto overfitting durante la creazione di diversi modelli statistici.
Aggiungiamo anche questo manuale molto utile: https://media.fupress.com/files/pdf/24/3581/3581_14308
5) Statistics 110
Statistics 110 è un altro canale Youtube creato dall’Università di Harvard, che consente di approfondire concetti statistici e di probabilità: abbiamo assiomi della probabilità, tipi di distribuzioni, il problema di Monty Hall, covarianza, correlazione, test Chi-quadrato, test T, catene di Markov e altro ancora.
L’aspetto migliore è che si parte da un livello base di conoscenze, quindi anche chi non è un esperto ci si può facilmente avvicinare.
apprendimento backpropagation data engineer deep learning discesa del gradiente imparare matematica ai libri gratuiti machine learning matematica R