Il Tredicesimo Cavaliere

Scienze dello Spazio e altre storie

L’era dei Big Data

800px-Satellite_ESA_GaiaLa missione principale di Gaia, la modernissima piattaforma astrometrica lanciata dall’ESA all’inizio del 2013, è catalogare circa un miliardo di corpi celesti fino a magnitudine 20. Gaia eseguirà misurazioni di altissima precisione della distanza, del moto proprio, della posizione e della velocità radiale di ogni stella misurata e anche di un gran numero di quasar, pianeti extrasolari e oggetti del sistema solare.

(nell’illustrazione: Gaia al lavoro)

Tramite misure fotometriche, inoltre, avremo informazioni sulla loro luminosità, gravità, temperatura e composizione chimica. Lo scopo ultimo di Gaia è di realizzare, in cinque o sei anni di lavoro, una dettagliatissima mappa in 3D della Via Lattea. Ecco un eccellente esempio di cosa s’intende per Big Data, ma ce ne sono molti altri. Per esempio il Large Hadron Collider (LHC) del CERN, l’acceleratore di particelle sepolto nel terreno alle porte di Ginevra (il più grande macchinario del genere al mondo), crea un enorme flusso di dati che ha bisogno, per essere elaborato, dell’intero tempo macchina di 150 centri di elaborazione dati sparsi in tutto il mondo.

lhc10(nell’immagine a fianco: una parte del LHC).

Lasciamo il settore scientifico, e consideriamo i servizi basati su Internet, che nel 2016 conterà 3,4 miliardi di utenti, pari al 45% della popolazione mondiale. Qui i Big Data si sprecano: si pensi che ogni giorno Facebook elabora 2,7 miliardi di “mi piace” e 2,5 miliardi di contenuti (stato, foto, video), mentre circolano 50 miliardi di tweet. Senza considerare le ricerche di Google e Yahoo, e le transazioni di Amazon. In estrema sintesi, è stato calcolato che nel 2009 il pianeta abbia prodotto 800 exabytes di informazione e abbia superato 1,6 zettabytes nel 2011. Per il futuro, ci si aspetta che i Big Data avranno la maggiore crescita nel settore del commercio, per sviluppare una migliore comprensione delle necessità e del comportamento dei consumatori; in quello della salute, dove è previsto l’estendersi della medicina sociale e di quella preventiva; e ancora in tutti i settori scientifici e tecnologici che confermano il loro trend di sviluppo tumultuoso.

Ma il diluvio continuo dei dati, in sé e per sé, non fornisce nuova informazione. Anzi, la nasconde. C’è un enorme potenziale, una profonda conoscenza che viene occultata dalla marea montante dei dati grezzi. Con Big Data, quindi, si esprime anche l’abilità nel manipolare, integrare, sincronizzare e amministrare la caterva disordinata dei dati in molti modi diversi, cioè la capacità di estrarre dal caos l’essenziale, la conoscenza nuova e originale. In sintesi potremmo dire che Big Data comprende anche Big Analytics.

francis_bacon(nell’illustrazione a fianco: Francis Bacon)

A questo proposito alcuni filosofi della scienza segnalano la necessità di una guida nella raccolta e l’elaborazione dei dati, analogamente a quanto accadde ai tempi di Galileo, quando si trattava di inventare da zero una metodologia che fosse adeguata alla nuova concezione del mondo. Se ne incaricò l’inglese Francis Bacon, che nel 1620, nel suo Novum Organum, pose le basi del moderno metodo induttivo. Ovvero, dice Elena Castellani su “Le Scienze” dello scorso gennaio, diede definizione a concetti come : “la raccolta ragionata dei dati (la costruzione della base induttiva), il confronto tra le basi induttive, il processo di generalizzazione per gradi, l’eliminazione delle ipotesi che non corrispondono ai requisiti richiesti, il ruolo degli esperimenti negativi, i criteri di scelta tra ipotesi empiricamente equivalenti, e via dicendo”. Nei secoli successivi il metodo induttivo ebbe alterne fortune, ma ora quello originario sembra essere rivalutato e la Castellani sottolinea che: ”Nella filosofia della scienza si è cominciato da qualche tempo a valutare l’impatto dei Big Data sulle questioni riguardanti natura e acquisizione della conoscenza scientifica. Quale tipo di induzione, in particolare, si configura per estrarre strutture ordinate da una mole indistinta di dati? Si tratta di un procedimento qualitativamente diverso dall’induzione di ispirazione baconiana?

Oltre agli interrogativi posti dalla Castellani, la gestione di grandi insiemi di dati, anzi la loro stessa esistenza, pone gravi problemi pratici. Per utilizzare i Big Data, servono evidentemente dei Big Server, cioè grandi centri di calcolo dotati di computer potentissimi. I consumi dei Big Server coprono oggi il 10% dei consumi di energia elettrica del pianeta, crescono del 7% l’anno e raddoppiano ogni 10 anni. Inoltre i computer si surriscaldano e vanno quindi raffreddati, ma per farlo è necessario un consumo di energia elettrica pari a quello richiesto per alimentarli e nelle località dove si scaricano le acque di raffreddamento si crea un problema di inquinamento termico.

bigdata5Ma per fortuna esiste una tecnologia astronautica, grazie alla quale nuove aziende come ConnectX e Server Sky possono offrire soluzioni radicali a questi problemi, dislocando i loro server sull’orbita geostazionaria. Lì infatti, una Server Farm potrà contare sull’energia solare per 24 ore al giorno, 365 giorni l’anno, senza fluttuazioni dovute a problemi meteorologici, a costo zero. E se l’impianto computerizzato fosse progettato opportunamente, si potrebbe dar vita a una struttura di tipo modulare lanciando uno sciame di piccoli satelliti, invece di pochi grandi satelliti, riducendo così drasticamente costi e rischi del lancio. Infine anche il problema del raffreddamento dei circuiti potrà essere risolto al risparmio usando opportune schermature.

Nella conferenza stampa di presentazione, ConnectX ha ammesso di sentirsi in competizione verso eventuali aziende con base a terra che volessero fornire analoghi servizi basandosi sull’uso dei futuribili computer quantici, ma fa rilevare che il loro approccio aziendale prevede l’uso di tecnologie ben note e quindi più economiche e a basso fattore di rischio.

Infine, Big Data significa anche archiviazione, stoccaggio e trasporto dei dati in spazi sempre più piccoli, come dice Paul Gilster: ”Ma come noi lavoriamo per estrarre valore dal flusso dei dati in entrata, così stiamo trovando modi di comprimere i dati in mezzi sempre più capienti, un prerequisito per le future sonde per lo spazio profondo, che, si spera, raccoglieranno informazioni a velocità mai raggiunte prima” (per approfondire: Archiviazione dati: l’ipotesi DNA).

bigdata6E ancora Gilster: “Mantenere viva l’informazione è qualcosa che deve essere ben presente agli occhi di popoli che cambiano continuamente i formati in cui organizzano i loro dati. Dopo tutto, preservare l’informazione è una parte fondamentale di ciò che noi facciamo come specie, è ciò che ci consente di avere una storia. Ci siamo organizzati per memorizzare i resoconti delle battaglie e delle migrazioni, e i cambiamenti culturali per mezzo di un ampio panorama di media, che va dalle tavolette di argilla ai compact disc. Ma nell’ultimo secolo abbiamo assistito al repentino cambiare dei dispositivi che utilizziamo per codificare dati, musica e video. Come possiamo mantenere tutto questo leggibile per chi verrà dopo di noi?

 

ROBERTO FLAIBANI

Fonti:

  1. ” The potential and the challenge of  Big Data – Recommendtion systems next level application” by Fatima El Jamiy, Abderrahmane Daif, Mohamed Azuozi, Abdelaziz Marzak – Hassan II University, Faculty of Science Ben m’Sik, Laboratoire MITI – Casablanca, Morocco – (arXiv.org)
  2. “Bacone e i Big Data” di Elena Castellani, Dipartimento di Filosofa, Università di Firenze – pubblicato da “Le Scienze” nel gennaio 2015, pag 16.
  3. Big Data computing above the clouds” by Vid Beldavs – pubblicato su “The Space Review” il 20 ottobre 2014
  4. Information and Cosmic Evolution” by Paul Gilster, pubblicato su “Centauri Dreams” il 16 febbraio 2015
Advertisements

16 marzo 2015 - Posted by | Epistemologia | , , , , , , , ,

Non c'è ancora nessun commento.

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

%d blogger hanno fatto clic su Mi Piace per questo: