Come imparare la matematica necessaria all’analisi dati?

Come imparare la matematica necessaria all’analisi dati?

10 Gennaio 2023 ai 0
matematica analisi dati

Un perito informatico, un ingegnere informatico o un informatico “puro” possono convertirsi al mondo dal data engineering e imparare la matematica.

Possono farlo anche persone che provengono da ambiti totalmente diversi, a patto di studiare le regole fondamentali della materia. Però serve una buona dose di conoscenza matematica, necessaria per analizzare i dati con cognizione di causa e per mettere a terra i ragionamenti corretti. Certo, spesso aziende diverse si ritrovano ad avere problemi simili e non è necessario creare delle nuove architetture da zero. In ogni caso il data engineer che conosce come funziona il meccanismo è enormemente avvantaggiato sul mercato, oltre che più versatile in ruoli e progetti diversi.

In questo articolo ti segnalo 5 risorse gratuite per imparare la matematica necessaria all’analisi dati.

5 strumenti gratuiti per imparare la matematica necessaria all’analisi dati

Come premessa, vorrei dire che qui parlerò più di corsi e strumenti utili a fornirti degli strumenti e dei concetti, più che a insegnarti l’abilità di calcolo. Infatti, del calcolo se ne possono facilmente occupare dei computer in modo molto più preciso di noi.

Però ad esempio alcuni concetti come la discesa del gradiente per trovare i valori di pendenza nei modelli di regressione lineare.

Poi, alcune tecniche di manipolazione delle matrici ti saranno utili se vuoi cimentarti nel deep learning.

Infine, anche la statistica torna utile per le analisi più complesse, che partono da un’ipotesi e che prevedono di saper interrogare i dati in una certa maniera.

Questi 5 strumenti, lo ribadisco, sono del tutto gratuiti e soddisfano diversi livelli di esperienza di chi si occupa di machine learning.

1) Serie di algebra lineare

Molti concetti di apprendimento automatico sono legati all’algebra lineare. Ad esempio, l’ACP richiede autovalori e la regressione richiede la moltiplicazione di matrici. Inoltre, la maggior parte delle applicazioni di ML si occupa di dati ad alta dimensionalità (dati con molte variabili). Questo tipo di dati è meglio rappresentato da matrici. Ecco alcune delle migliori risorse gratuite che abbiamo trovato per imparare l’algebra lineare per la data science.

Per ruoli fortemente applicativi:
Khan Academy offre brevi lezioni pratiche di algebra lineare. Coprono gli argomenti più importanti.

Per ruoli fortemente di ricerca e sviluppo:
MIT OpenCourseWare offre un corso rigoroso di algebra lineare. Le lezioni video e i materiali del corso sono tutti inclusi.

E se hai solo bisogno ancora:
Il Ricettario delle Matrici (PDF) – Eccellente risorsa di riferimento per l’algebra delle matrici.

2) Serie 3Blue1Brown’s Calculus Series

Se invece vuoi arrivare a un livello di calcolo migliore, c’è questa seconda risorsa del canale 3Blue1Brown che aiuta molto a capire alcuni elementi utili nell’implementazione dell’algoritmo di discesa del gradiente. Dello stesso gruppo abbiamo anche un buon programma di Deep Learning, più incentrato su chi studia l’intelligenza artificiale. 

3) 3Blue1Brown’s Deep Learning Series

Mentre la loro serie di calcolo è più generale e si rivolge a chiunque desideri migliorare le proprie conoscenze in matematica, la serie di deep learning di 3Blue1Brown è stata creata appositamente per gli studenti interessati all’intelligenza artificiale.

La serie di deep learning ti guiderà attraverso il funzionamento interno di una rete neurale e come questi modelli sono in grado di apprendere schemi dai dati.

Ti verrà fornita una spiegazione approfondita dell’algoritmo di backpropagation e di come funziona, insieme ai concetti di calcolo alla base di esso.

4) Introduzione all’apprendimento statistico

Ottimo libro se vuoi iniziare ad avvicinarti al machine learning, questo testo è disponibile online e può essere scaricato gratuitamente in lingua inglese. Oltre alla parte teorica, nel manuale abbiamo anche alla fine di ogni capitolo un serie di esercizi in R.

Qui si parla di alberi decisionali, regressione lineare, regressione logistica e quando usarli per rispondere a determinate necessità. Insieme a questi, si acquisisce una comprensione intuitiva del funzionamento dei modelli lineari, degli algoritmi ad albero e delle tecniche non supervisionate. 

È un manuale particolarmente utile se vuoi capire come evitare il temuto overfitting durante la creazione di diversi modelli statistici.

Aggiungiamo anche questo manuale molto utile: https://media.fupress.com/files/pdf/24/3581/3581_14308

5) Statistics 110 per imparare la matematica

Statistics 110 è un altro canale Youtube creato dall’Università di Harvard, che consente di approfondire concetti statistici e di probabilità: abbiamo assiomi della probabilità, tipi di distribuzioni, il problema di Monty Hall, covarianza, correlazione, test Chi-quadrato, test T, catene di Markov e altro ancora.

L’aspetto migliore è che si parte da un livello base di conoscenze, quindi anche chi non è un esperto ci si può facilmente avvicinare. 

 

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *