Indica un intervallo di date:
  • Dal Al
tecnologia

La data science è automatizzata. Non servono più i data scientist

Il Mit ha sviluppato un tool che permette a chiunque di fare data science. L’obiettivo con cui è stato annunciato è quello di rendere più democratica la scienza dei dati. In realtà, il software sviluppato dai ricercatori del Mit non fa altro che svolgere compiti che normalmente sono affidati ad uno statistico o ad un data scientist junior. L’idea di fondo è quella di permettere di estrarre senso dai dataset anche ad aziende troppo piccole per assumere scienziati dei dati.

 

Sì, perché il codice scritto a Cambridge altro non fa che generare in automatico dei modelli che consentono di analizzare dati grezzi. Così che chiunque, anche senza esprienza nel settore, sia in grado di dedicarsi alla data science. Presentandolo al simposio sui principi dei linguaggi di programmazione organizzato da Acm Sigplan a Lisbona dall’8 al 13 gennaio, i ricercatori del Mit lo hanno definito come uno strumento in grado di generare modelli statistici sofisticati. Capace non solo di analizzare i dati, ma anche di formulare previsioni a partire da queste ultime.

Qui sotto una dasboard di sintesi su come è cambiato il mercato del lavoro. Realizzata da Ben Jones, direttore di Tableau Public, la piattaforma free di datavisualization sviluppata da Tableau Software. Il quale ha pubblicato su data.world sia il database che una visualizzazione tratta da questi dati. Una dataviz che permette di comprendere con un colpo d’occhio come è cambiato il mercato del lavoro negli ultimi anni.

 

L’idea infatti è che questo software permetta a chi lo utilizza di predire l’andamento di una contesa elettorale, il diffondersi di un’epidemia, la puntualità dei voli durante una stagione. Il tutto scrivendo solo quelle poche rigue di codice necessarie per inserire i dati nel software. «La mancanza di figure professionali capaci di analizzare i dati è una problematica largamente riconosciuta», spiega in una nota Vikash Mansinghka, uno degli autori del progetto, «e questo è un problema negli enti governativi, nel non profit e in tutte quelle realtà dove non ci si può permettere un data scientist».

 

La soluzione è appunto questo tool che attualmente è disponibile su Jupyter Notebook, un’ambiente web open source che permette di far girare un software all’interno di un browser. Il tool utilizza dei modelli bayesiani, che consentono ad esempio di elaborare previsioni sugli sviluppi futuri di un fenomeno basandosi su serie storiche. O dei valori sulla base di diversi variabili, ad esempio lo stipendio di una persona a partire dalla sua età, dall’occupazione e dall’area geografica in cui la svolge.

 

Si tratta di modelli molto utilizzati, ma che richiedono un notevole sforzo in termini di tempo. Oltre, ovviamente, al lavoro di uno o più statistici. Il tool sviluppato dal Mit richiede invece semplicemente l’inserimento del dataset: al resto penserà il software. L’idea è quella di fornire uno strumento che permetta di fare esattamente quello che fa ad esempio Nate Silver per le sue previsioni elettorali su FiveThirtyEight. Con il vantaggio che per capire dai dati chi vincerà la prossima corsa alla Casa Bianca non servirà assoldare eserciti di statistici, ma semplicemente utilizzare il software scritto a Cambridge. O almeno, questo promette chi lo ha scritto.

Ultimi commenti
  • Albertine Meroni |

    Un’ulteriore spinta a potenziare le proprie competenze, é così che leggo questo articolo.

    Per come la vedo io questo articolo non segna un punto di svolta come il suo titolo ad effetto sembrerebbe suggerire ma tradisce una certa superficialità nell’indagare cosa sia la Data Sciense e cosa facciano i Data Scientists, alla stregua di chi giudicava la Data Sciense una moda del momento o una bolla che sarebbe presto scoppiata o come chi al contrario vedeva la Data Sciense come la risposta a tutto e il Data Scientist come colui che aveva la bacchetta magica.

    Da questo articolo sembrerebbe che ora sia stata realizzata la bacchetta magica democraticamente resa disponibile a tutti.

    Il problema é che non é la Data Sciense in sé e per sé a dover essere resa accessibile a tutti bensì il senso e il valore racchiuso nei dati. Per farlo occorre un esperto Data Scientist. Per estrarre valore dai dati sono necessari lavoro, competenze e senso critico perchè i dati hanno bisogno di una fase di preparazione e di una attenta gestione e organizzazione prima di essere analizzati, perchè le richieste del committente sono spesso generiche e sta al Data Scientist tradurle in analisi fattibili che soddisfino le esigenze del cliente. Inoltre il Data Scientist deve saper lavorare a stretto contatto con gli esperti di dominio ovverosia coloro che conoscono appieno la materia concernente i dati in analisi e infine deve saper veicolare i risultati anche a un pubblico non esperto e non tecnico, sfruttando una certa dose di creatività nel creare le visualizzazioni. Si deduce facilmente che a un bravo Data Scientist sono richieste diverse caratteristiche tra cui le famose ‘soft skills’ che una macchina non può avere.

    A ben vedere questo genere di lavoro non è così nuovo, la novità sta nella crescita esponenziale che ha avuto la produzione di dati di ogni tipo e la conseguente richiesta di esperti di dati; tutto ciò unito alla difficoltà di trovare professionisti che avessero al tempo stesso competenze di data engeneering, statistics, data analysis e data visualisation ha portato alla celebre similitudine dei Data Scientists come unicorni e alle elevate retribuzioni associate a tale professione. Ad oggi il numero di corsi di laurea e master per formare Data Scientists è aumentato notevolmente e questo unito al fatto che si vanno diffondendo algoritmi di auto machine learning può portare a supporre che presto i livelli di retribuzione della maggior parte dei Data Scientists si allineeranno con livelli normali, forse questo poteva essere un buon argomento per l’articolo che si sarebbe potuto intitolare “è finita l’età dell’oro per i Data Scientists”. Alla domanda: potrà un algoritmo ben sostituire un Data Scientists? La mia risposta è no a meno che non si tratti di un Data Scientist che si limita a eseguire meramente algoritmi che nemmeno padroneggia. Rimarranno i Data Scientists degli unicorni? é difficile dirlo, certo il numero di aventi il titolo di Data Scientist sta aumentando ma rimane comunque difficile avere una persona che incarni tutte le dovute caratteristiche infatti spesso si tende ad avere almeno due persone distinte un Data Engineer e un Data Analyst. Non servono più i Data Scientists? Servono eccome e a corollario di tutte queste domande mi diventa sempre più chiaro che chi voglia diventare un buon Data Scientist debba puntare quotidianamente a migliorarsi, a potenziare le proprie competenze sia per dare un contributo significativo laddove sembra che col minimo sforzo ci si possa limitare a dare i dati grezzi in pasto a un algoritmo, sia per distinguersi in un mercato in cui la concorrenza è in aumento.

  • Michele |

    È stato rilasciato?Si può avere un link?

  • Lisa |

    Bayesian synthesis of probabilistic programs for automatic data modeling.
    Saad, F. A.; Cusumano-Towner, M. F.; Schaechtle, U.; Rinard, M. C.; and Mansinghka, V. K.
    Proc. ACM Program. Lang., 3(POPL): 37:1-37:29. January 2019. Presented at the 46th ACM SIGPLAN Symposium on Principles of Programming Languages, POPL’19.

  • Luca |

    Ma non è quello che dichiarano di fare altre piattaforme come Qlik, Cognos? Citare Tableau è come dichiarare che l’articolo sia di parte… è una mia impressione

  • Weeee |

    La prossima volta fate scrivere l’articolo a qualcuno che sa di cosa sta parlando per favore

Suggeriti