Salta ai contenuti

ETL

ETL è il viaggio dei dati da una sorgente a una destinazione

Sezione intitolata “ETL è il viaggio dei dati da una sorgente a una destinazione”

ETL significa:

  1. Extract: prendi i dati
  2. Transform: li sistemi
  3. Load: li carichi nel database

Pensa a un pacco che arriva in magazzino. Prima lo scarichi, poi controlli e sistemi il contenuto, infine lo metti nello scaffale giusto.

Immagina di ricevere ogni giorno un file CSV da un altro sistema.

Prima lo leggi, poi sistemi i valori sporchi o incompleti, infine carichi i dati nel database. Questo è ETL.

Durante Transform potresti:

  • correggere date scritte in formati diversi
  • eliminare righe duplicate
  • convertire testi in maiuscolo o minuscolo
  • controllare valori mancanti

È un concetto molto comune quando i dati arrivano da sorgenti diverse e non sono subito pronti per entrare nel tuo sistema.

Non è solo spostare dati da A a B. È fare in modo che arrivino puliti, coerenti e nel formato giusto.

Questo fa una grande differenza quando i sistemi coinvolti diventano molti.