Siete assetati di ulteriori approfondimenti da parte di esperti?

Iscriviti alla nostra newsletter Tea O'Clock!

Abbonati

Il Data Scientist non esiste

Elodie Zanella
Pubblicato su
14/1/2021
Scienziati dei dati - persone con il "lavoro più sexy del 21° secolo", una carriera del futuro o un lavoro di breve durata, o anche solo una parola d'ordine? Essere un Data Scientist ha molte sfaccettature al giorno d'oggi, quindi cerchiamo innanzitutto di definire il termine.

Secondo Wikipedia, "la scienza è un'impresa sistematica che costruisce e organizza la conoscenza sotto forma di spiegazioni e previsioni verificabili". Se torniamo al significato originale del termine, un Data Scientist è qualcuno che sperimenta con i dati, una sorta di ricercatore erudito che studia i fenomeni fondamentali, sia dei dati che grazie ai dati. Aggiungendo un pizzico di pragmatismo, la scienza dei dati può essere descritta come un vasto campo scientifico che estrae conoscenza utilizzando una serie di manipolazioni da un dato insieme di dati al fine di risolvere problemi specifici.Questo ci porta alla nostra prossima domanda: chi sono questi Data Scientist di cui tutti parlano?

Le università creano macchine per l'apprendimento automatico

Molte università offrono corsi di scienza dei dati, apparentemente un "must" per l'istruzione superiore. Anche se si sono evoluti, la maggior parte di questi corsi di formazione trasformano gli studenti in apprendisti meccanici. Insegnano loro gli ultimi algoritmi e come padroneggiare Kaggle, concentrandosi soprattutto sulla modellazione della grande catena di valore della scienza dei dati.L'apprendimento automatico, nato negli anni '50, è un insieme di strumenti creati per consentire ai computer di svolgere compiti sempre più veloci e precisi. Il contesto aziendale, la realtà dei dati e la loro interpretabilità vengono talvolta trascurati per concentrarsi sull'ottimizzazione di metriche difficilmente utilizzabili in azienda. Torniamo a Kaggle per illustrare questo aspetto: gli utenti di questa piattaforma devono applicare tecniche altamente sofisticate a insiemi di dati prontamente disponibili, di cui non sempre si conosce l'origine, con l'obiettivo finale di raggiungere il punteggio più alto nella scala di predizione. Sebbene le conoscenze di Machine Learning, sia teoriche che pratiche, siano fondamentali per risolvere un problema, di solito non sono sufficienti in un ambiente aziendale, dove la chiave per risolvere un problema è la conoscenza e la comprensione del contesto aziendale, la disponibilità di dati qualificati e di strumenti di interpretazione appropriati per sfruttare i risultati. Va anche detto che il 50% dei progetti di Data Science fallisce, in parte a causa delle difficoltà di accesso alle giuste competenze (studio IDC).Ma non abbiamo ancora detto con precisione chi sono questi Data Scientist...

Il mitico unicorno

Già nel 2012, l' Harvard Business Review sosteneva che i Data Scientist avevano il "lavoro più sexy del 21° secolo", senza fornire molti dettagli. È difficile essere specifici quando si sa che fanno cose molto diverse a seconda che siano Data Scientist di Airbnb, JPMorgan Chase o General Motors. Ma, a prescindere dalle differenze, tutti condividono una caratteristica: l'attenzione al business. L'obiettivo della scienza dei dati è infatti quello di utilizzare i dati per risolvere i problemi di un'azienda, come la manutenzione predittiva, il rilevamento delle frodi, i percorsi di acquisto personalizzati o le raccomandazioni di contenuti, per citarne alcuni:

  • Una solida comprensione delle esigenze aziendali e la capacità di proporre un approccio rigoroso e pragmatico alla soluzione dei problemi dell'azienda.
  • Conoscenza dell'architettura tecnica al fine di creare e implementare la migliore architettura possibile a supporto del progetto.
  • Una buona padronanza degli strumenti di analisi dei dati, di descrizione statistica e di visualizzazione per comprendere i dati e guidare le scelte di elaborazione e modellazione
  • Capacità di estrazione, preparazione e gestione dei dati
  • Conoscenze statistiche e di apprendimento automatico, se il progetto richiede una modellazione
  • La capacità di interpretare i risultati analitici e/o di modellazione, di trarre conclusioni attuabili da tali risultati e di spiegare tali conclusioni in modo comprensibile e attuabile dai team di progetto.
  • La capacità di supportare l'implementazione dei risultati (ad esempio, la creazione e l'automatizzazione di una soluzione azionabile quando viene rilevata una frode, o l'implementazione di una strategia efficiente per la condivisione di contenuti personalizzati su un sito web o tramite una campagna di email marketing).

... e di misurare i risultati per migliorare costantemente le tecniche!

E se il termine "Data Scientist" fosse in realtà un termine improprio? E se la scienza dei dati fosse il lavoro di un intero team, con diverse competenze?

Fare luce sul mito del Data Scientist

In realtà, la scienza dei dati non può essere responsabilità di una sola persona in un'azienda. Per ricoprire questo ruolo sono necessari diversi profili:

  • Un Data Project Manager: con un'acuta strategia aziendale e una solida comprensione delle sfide tecniche, il data project manager sfrutterà le competenze del team e creerà un piano per soddisfare le esigenze dell'azienda, assicurandone al contempo la perfetta attuazione.
  • Uno o più analisti di dati: dotati di competenze analitiche, preparano e analizzano i dati - in formato SQL, utilizzando strumenti di visualizzazione o statistici - per rispondere a domande specifiche del team di progetto e per presentare i risultati in modo utile e d'impatto.
  • Uno o più Machine Learner: in parte statistici, in parte sviluppatori, lavorano con grandi quantità di dati per identificare modelli nascosti e prevedere comportamenti o eventi.
  • Uno o più Data Architect: progettano, implementano e gestiscono l'architettura complessiva a supporto dell'elaborazione dei dati, tenendo sempre d'occhio la scalabilità, la resilienza e la capacità di evoluzione della soluzione.
  • Uno o più Data Engineer: programmano e gestiscono la raccolta, l'archiviazione e la distribuzione dei dati, che a loro volta vengono utilizzati dai Data Analyst e dai Machine Learner. Poiché i Data Architect e i Data Engineer richiedono competenze simili, questi ruoli possono talvolta essere ricoperti dalla stessa persona.

È fondamentale per un'azienda chiarire i diversi ruoli di ciascuno di questi "Data Scientist". Questo aiuterà il processo di assunzione, eviterà qualsiasi malinteso sul ruolo, favorirà l'affiatamento del team e garantirà il successo dei progetti data-driven.Noi di fifty-five utilizziamo questi principi per adattare le nostre strategie alle competenze e alle risorse disponibili dei nostri clienti, per consentire loro di raggiungere i loro obiettivi. Ecco perché abbiamo i diversi profili descritti sopra:

L'obiettivo non è trovare l'unico Data Scientist in grado di fare tutto, ma identificare le esigenze e i punti di forza di ciascuno per creare un team di Data Science funzionale e soddisfatto e sfruttare appieno le competenze di ciascuno. In definitiva, la chiave è... lagovernance!

Tutti gli articoli

Articoli correlati

Granularità: una chiave per misurare e ottimizzare l'efficacia del marketing?

8 minuti
Mathieu Lepoutre

Come ottenere resilienza, agilità e controllo sui dati con il tracciamento lato server

5 minuti
Alain Friedli

Analitica creativa: Alimentare l'immaginazione con gli approfondimenti

7 minuti
Margaux Montagner

Volete saperne di più? Iscrivetevi alla nostra newsletter mensile.

Scoprite tutte le ultime notizie, articoli, repliche di webinar e cinquantacinque eventi nella nostra newsletter mensile, Tea O'Clock.

Nome*
Cognome*
Azienda*
Lingua preferita*
Email*
 Grazie!

La tua richiesta di abbonamento è stata presa in considerazione con successo.
Oops! Qualcosa è andato storto durante l'invio del modulo.