Da dove provengono i dati?
Per offrire ai propri utenti tutta la potenzialità delle informazioni, Atoka attinge a vari database e a varie tecnologie che permettono di costruire la scheda di quasi 6 milioni di aziende.
Tra le fonti più utilizzate, c’è InfoCamere, società che gestisce il Registro delle Imprese delle Camere di Commercio. Tutti i dati provenienti da questa fonte vengono corretti, integrati, arricchiti e continuamente aggiornati tramite il lavoro quotidiano degli analisti Cerved.
Inoltre, Atoka sfrutta la tecnologia proprietaria di analisi semantica.
In questo caso, i dati provengono dalla lettura di fonti pubblicamente accessibili (sito web, canali social, …) effettuata da programmi automatici che utilizzano algoritmi del tutto simili a quelli dei comuni motori di ricerca (es. Google, Bing, Yahoo, etc). Questi dati sono sottoposti a controlli di qualità sia automatici che manuali per garantire la miglior qualità dell’informazione.
Nel dettaglio, ecco da dove provengono i seguenti dati e con che frequenza vengono aggiornati:
Tipo di dato | Fonte | Frequenza aggiornamento |
---|---|---|
Bilanci | rielaborazione Cerved a partire da dato Infocamere dei bilanci depositati in Camera di Commercio | settimanale |
Immobili | da SISTER (gestito dall’Agenzia delle Entrate). A queste informazioni Cerved aggiunge una stima relativa al valore dell’immobile | settimanale |
Sedi | da Infocamere, dato processato da Cerved. Sono comprese sia le sedi legali che quelle secondarie (unità locali) | settimanale |
Codice Ateco | da Infocamere. Ove mancante o non pertinente, Cerved ricostruisce l’informazione utilizzando dati ufficiali come l’attività prevalente, bilanci ed altro | giornaliero |
Dipendenti | da Infocamere (via INPS) | trimestrale |
Partecipazioni | da Infocamere, sottoposto a controllo qualità Cerved. Sotto una soglia minima molto bassa non vengono mostrate su Atoka | giornaliero |
Persone | la fonte primaria è sempre il Registro Imprese | settimanale |
Score | elaborazioni proprietarie di Cerved e SpazioDati che utilizzano molteplici fonti per produrre stime della probabilità di default, propensione al mercato estero, centralità all’interno del grafo dei siti web, ed altri. | settimanale o mensile |
Contatti | sia da fonti ufficiali (Infocamere, pubblica amministrazione), che non ufficiali (siti web, SERP, social) | giornaliero |
P.IVA | da Infocamere | giornaliero |
Parola Chiave | elaborazione SpazioDati a partire da dati Infocamere (oggetto sociale), testo del sito web e account social | settimanale |
Website | SpazioDati utilizza tecniche di crawling del web per poter ottenere un database esaustivo dei possibili siti web corporate | mensile |
Contratti pubblici | dati esposti dall’Autorità Nazionale Anticorruzione e processati da SpazioDati | giornaliero |
Marchi registrati | dati esposti dagli uffici brevetti e marchi di EUIPO, UIBM, USPTO, WIPO e processati da SpazioDati | bi-settimanale |
Aiuti di stato | dati esposti dal Registro Nazionale Aiuti di Stato e processati da SpazioDati | bi-settimanale |
Eventi negativi | dati di Infocamere (protesti, procedure concorsuali, fallimenti) e di Agenzia delle Entrate (pregiudizievoli e altri atti di conservatoria) processati da Cerved | giornaliero / settimanale |
Notizie | dati forniti da data provider privato, processati da Cerved e SpazioDati | giornaliero |
Il Registro delle Imprese, già previsto dal Codice Civile, ha avuto completa attuazione con la Legge 580 del 1993 relativa al riordino delle Camere di Commercio e con il successivo Regolamento di attuazione e la sua gestione è affidata alle Camere di Commercio.