15 febbraio 2021

Orange: analizzare e valutare gratis i dati raccolti in azienda!

Oggi le imprese, non importa quale sia la loro dimensione, sono in grado di raccogliere un'enorme mole di dati, quelli che vengono chiamati big data. Grazie a tutti questi dati possono ricavare informazioni preziose sulla segmentazione dei clienti, individuazione di nuovi mercati su cui allargarsi o come gestire la distribuzione.

Però tutto questo diventa possibile solo se l'impresa è in grado di analizzare e valutare tutti i dati raccolti; infatti nella loro forma grezza i dati restano senza valore.

Ci sono molti strumenti che consentono di applicare sui dati raccolti delle tecniche avanzate di analisi ma di solito hanno costi non sempre alla portata di tutti e molto spesso richiedono anche un certo grado di conoscenza tecnica agli utilizzatori.

Però ancora una volta il mondo dell'open source ci viene in soccorso grazie ad Orange.

Si tratta di un pacchetto software di programmazione visiva per la visualizzazione dei dati, l'apprendimento automatico, il data mining e l'analisi dei dati.

La programmazione visiva viene realizzata tramite un'interfaccia in cui vengono creati dei flussi di lavoro collegando dei widget predefiniti oppure progettati dall'utente, mentre gli utenti avanzati possono utilizzare Orange come libreria Python per la manipolazione dei dati e l'alterazione dei widget.

I widget offrono funzionalità di base come la lettura dei dati, la visualizzazione di una tabella di dati, la selezione di funzionalità, i predittori di addestramento, il confronto di algoritmi di apprendimento, la visualizzazione di elementi di dati, ecc. L'utente può esplorare interattivamente le visualizzazioni o inserire il sottoinsieme selezionato in altri widget.

In ambito scientifico Orange viene utilizzato come piattaforma per testare nuovi algoritmi di apprendimento automatico e per implementare nuove tecniche in genetica e bioinformatica. Nell'istruzione, è stato utilizzato per insegnare metodi di machine learning e data mining agli studenti di biologia, biomedicina e informatica.

Orange è molto apprezzato dai suoi utilizzatori per la velocità e la facilità con cui avviene la visualizzazione dei dati. Infatti una volta immessi i dati il programma li prepara subito sotto forma visuale. Oltre a ciò Orange impara a conoscere con il tempo le preferenze dei suoi utenti e si regola di conseguenza, rendendo l’utilizzo di questo strumento ancora più agevole. L'uso di Orange risulta quindi molto più facile rispetto agli altri software dello stesso genere e ciò consente di prendere decisioni relative alla propria attività in modo veloce.

Quindi se anche voi volete analizzare e valutare i dati raccolti in azienda ma volete uno strumento tanto potente quanto economico allora Orange è lo strumento ideale per avvicinarsi al data mining.

Se ti è piaciuto l'articolo, segui il feed per tenerti sempre aggiornato sui nuovi contenuti del blog!

11 febbraio 2021

Singer: raccogliere gratis dati da tante fonti!

I dati sono uno strumento potente per le aziende poiché forniscono loro informazioni che possono essere elaborate in modi diversi. L'obiettivo principale è utilizzare queste informazioni per prendere decisioni. Pertanto, la raccolta dei dati è parte delle attività quotidiane: ogni azienda raccoglie e utilizza ogni sorta di dati.

Oggi le fonti da cui è possibile estrarre dati sono tante e diversificate: siti web, social media, sistemi informativi, newsletter e via discorrendo. Diventa quindi fondamentale riuscire a recuperare i dati da tutte queste fonti in tempi rapidi ed in maniera la più standard possibile.

Ancora una volta viene in soccorso il mondo dell'Open Source: il progetto Singer.

Si tratta di uno standard open source per la scrittura di script che spostano i dati. In pratica Singer descrive come dovrebbe comunicare gli script di estrazione dei dati, chiamati "tap", e gli script di caricamento dei dati, chiamati "target", consentendo loro di essere utilizzati in qualsiasi combinazione per spostare i dati da qualsiasi origine a qualsiasi destinazione. E' possibile inviare dati tra database, API web, file, code e qualsiasi altra cosa possiamo pensare.

I tap ed i target di Singer sono semplici applicazioni composte da pipe: non sono necessari demoni o plug-in complicati. Le applicazioni Singer comunicano con un formato basato su JSON, rendendole facili da lavorare e implementare in qualsiasi linguaggio di programmazione. Singer supporta anche JSON Schema per fornire ricchi tipi di dati e una struttura rigida quando necessario.

Sebbene Python sia il linguaggio preferito per la scrittura di integrazioni, i programmi scritti in qualsiasi linguaggio possono essere conformi alle specifiche Singer.

Quindi se avete necessità di estrarre dati da fonti diverse per poi essere utilizzati per i vostri scopi allora Singer vi semplificherà il compito.

Se ti è piaciuto l'articolo, segui il feed per tenerti sempre aggiornato sui nuovi contenuti del blog!