11 febbraio 2021

Singer: raccogliere gratis dati da tante fonti!

I dati sono uno strumento potente per le aziende poiché forniscono loro informazioni che possono essere elaborate in modi diversi. L'obiettivo principale è utilizzare queste informazioni per prendere decisioni. Pertanto, la raccolta dei dati è parte delle attività quotidiane: ogni azienda raccoglie e utilizza ogni sorta di dati.

Oggi le fonti da cui è possibile estrarre dati sono tante e diversificate: siti web, social media, sistemi informativi, newsletter e via discorrendo. Diventa quindi fondamentale riuscire a recuperare i dati da tutte queste fonti in tempi rapidi ed in maniera la più standard possibile.

Ancora una volta viene in soccorso il mondo dell'Open Source: il progetto Singer.

Si tratta di uno standard open source per la scrittura di script che spostano i dati. In pratica Singer descrive come dovrebbe comunicare gli script di estrazione dei dati, chiamati "tap", e gli script di caricamento dei dati, chiamati "target", consentendo loro di essere utilizzati in qualsiasi combinazione per spostare i dati da qualsiasi origine a qualsiasi destinazione. E' possibile inviare dati tra database, API web, file, code e qualsiasi altra cosa possiamo pensare.

I tap ed i target di Singer sono semplici applicazioni composte da pipe: non sono necessari demoni o plug-in complicati. Le applicazioni Singer comunicano con un formato basato su JSON, rendendole facili da lavorare e implementare in qualsiasi linguaggio di programmazione. Singer supporta anche JSON Schema per fornire ricchi tipi di dati e una struttura rigida quando necessario.

Sebbene Python sia il linguaggio preferito per la scrittura di integrazioni, i programmi scritti in qualsiasi linguaggio possono essere conformi alle specifiche Singer.

Quindi se avete necessità di estrarre dati da fonti diverse per poi essere utilizzati per i vostri scopi allora Singer vi semplificherà il compito.

Se ti è piaciuto l'articolo, segui il feed per tenerti sempre aggiornato sui nuovi contenuti del blog!

0 comments:

Posta un commento