La collaborazione Large Hadron Collider Beauty (LHCb) del CERN, uno dei quattro grandi esperimenti al superacceleratore di Ginevra, dedicato allo studio della fisica dei quark pesanti, ha reso pubblico per la prima volta un ampio set di dati acquisiti dal rivelatore: lo rende noto l’INFN, Istituto Nazionale di Fisica Nucleare. I dati, già disponibili sul portale Open data del CERN, rappresentano circa il 20% del totale delle informazioni registrate da eventi di collisione protone-protone durante il Run 1 del Large Hadron Collider. L’iniziativa si inserisce nell’ambito della politica di Open data del CERN, che riflette i valori di trasparenza e di collaborazione internazionale sancite dalla convenzione ratificata da tutti gli stati membri del laboratorio, Italia compresa, da quasi 70 anni. I 200 Terabyte di dati pubblicati sono parte degli stessi che hanno già consentito di realizzare oltre 600 pubblicazioni scientifiche, che includono anche significative scoperte, grazie alle analisi condotte sugli eventi registrati nel corso dell’ultimo decennio.
I dati pubblicati sono il risultato di una preelaborazione effettuata sulle informazioni grezze fornite dal complesso sistema di rivelatori di LHCb, che hanno consentito la ricostruzione dei segnali sperimentali d’interesse, come le traiettorie delle particelle cariche prodotte a seguito delle collisioni tra protoni. I dati così ottenuti sono stati inoltre selezionati e classificati sulla base di circa 300 processi e decadimenti, e resi disponibili nello stesso formato utilizzato dai fisici di LHCb.
Per consentire a tutti gli utenti, e non solo ai componenti della comunità dell’esperimento e della fisica, l’utilizzo e la comprensione dei campioni degli eventi, i dati sono accompagnati da un’ampia documentazione e da metadati, oltre che da un glossario in cui sono contenute le spiegazioni di diverse centinaia di termini, utili per comprendere il lavoro di preelaborazione svolto dalla collaborazione LHCb. L’analisi del database è ulteriormente facilitata da algoritmi espressamente dedicati a LHCb, disponibili come software open source.
“Sia LHC che LHCb”, spiega Vincenzo Vagnoni, responsabile nazionale di LHCb per l’INFN, “sono il frutto di un grande sforzo collettivo che ha coinvolto paesi e ricercatori di tutto il mondo, ed è quindi giusto che i dati raccolti tramite questi strumenti siano messi a disposizione di chiunque ne voglia fare buon uso. Il modo con cui il database è stato reso disponibile potrà infatti aiutare le ricerche in ambiti diversi della fisica e aprire nuovi indirizzi in altri settori, come quelli dedicati ai Big Data e all’intelligenza artificiale”.