La modernizzazione dei processi di produzione, di vendita e relazione con i clienti sta inondando le aziende con enormi moli di dati, informazioni che rischiano di restare senza utilità in mancanza di progetti di data science più efficaci.
Se da una parte in quasi tutte le aziende sono in uso sistemi di reporting e applicazioni di business intelligence, dall’altra è molto difficile trovare strumenti all’altezza dei business data-driven o abbastanza affidabili da potervi basare le strategie future. Cosa manca? Manca la capacità di fare dei buoni progetti di data science, perché questi richiedono competenze diverse – matematiche, informatiche, di business e anche organizzative aziendali – che sono difficili da mettere insieme.
Per questo, molte iniziative rischiano di arenarsi nel cantiere dove nascono, di solito il reparto IT; i dati non ottengono la fiducia degli utilizzatori, non incidono su processi e organizzazione e quindi sul vantaggio competitivo.
>Vediamo di seguito i punti critici di un progetto di data science.
La conduzione di un progetto di data science ha bisogno di metodo ed esperienza. Si comincia dalla definizione formale del problema, segue il process-data mapping (ossia l’individuazione dei dati associati ai processi), quindi il vero data mapping con la verifica sulla qualità dei dati e successivamente le trasformazioni sui dati e la presentazione dei risultati per la validazione da parte degli esperti dell’industry di riferimento.
Soltanto dopo questa fase si può passare alla costruzione dell’algoritmo/modello con i requisiti di performance desiderati. Prima di andare in produzione, il modello va testato e validato come prototipo, poi inserito all’interno di un processo ingegnerizzato di gestione del ciclo di vita che ne controlla l’affidabilità e ne fa il fine tuning. Controlli automatici confrontano il risultato con i dati reali, lo aggiustano finché derive eccessive non segnalano all’analista la necessità di una revisione del modello.
La fase di preparazione dei dati è la più onerosa dei progetti di data science, in essa vengono alla luce le esigenze di lavorare su qualità, duplicazione e arricchimento dei dati che costringono a rivedere gli scopi del progetto e spesso anche i budget previsti. La costruzione del modello non occupa invece più del 10-20% del tempo.
L’impegno del CIO è fondamentale per garantire al progetto di data science la giusta sponsorship a livello aziendale. È importante affiancare gli specialisti IT e condividere i dati con persone del business per evitare che il progetto diventi un esercizio tecnico con scarse implementazioni pratiche. Nel caso in cui siano i reparti business a chiedere l’apporto della data science, il CIO deve preoccuparsi di rendere disponibili i dati e mettere a fattor comune le risorse. Da parte dell’IT c’è spesso diffidenza nell’aprire “lo scrigno” dei dati, il più delle volte segregati in silos malgrado i cambiamenti delle organizzazioni aziendali. Per poter entrare nel circolo virtuoso della valorizzazione, i dati devono poter essere accessibili a realtà esterne, ai consulenti e caricabili sulle applicazioni più innovative. In quest’ottica, il CIO deve saper valutare le competenze delle persone attorno al tavolo del progetto di data science e capire altresì quando è necessario l’apporto degli specialisti esterni.