BYTERFLY, IL BRUCO,LA CRISALIDE E LA FARFALLA:DALL’OPAC LOCALE AL GATEWAY INTERNAZIONALE

Cultura digitale

1653016975CULTURA_DIGITALE__R12_Byterfly,_il_bruco,_la_crisalide_e_la_farfalla__dall_OPAC_locale_al_gateway_internazionale.jpg

L’articolo, elaborato da Grazia Biorci, Giancarlo Birello, Antonella Emina, Anna Perin, Isabella Maria Zoppi,descrive l’esperienza maturata dall’Istituto di Ricerca sulla Crescita Economica sostenibile del Consiglio Nazionale delle Ricerche (CNR-IRCrES) nello sviluppo di repository e in particolare di Byterfly. Gli autori sono parte dello staff del CNR-IRCrES che collabora a Byterfly.


Byterfly è un repository ossia una biblioteca digitale caratterizzata dall’aggettivo open e dal sostantivo crescita. Open rimanda a open access per contenuti; open data per filosofia di conservazione, fruizione e riuso; open source per architettura e software. Per quanto riguarda la crescita, in Byterfly crescono le pagine accessibili, gli oggetti conservati e le iniziative collaterali di invito alla lettura e all’utilizzo dei materiali, così come crescono costantemente i numeri degli accessi e dei download.

cms_26112/0.jpgLa prima iniziativa di digitalizzazione portata avanti dal CNR-IRCrES, denominata DigiBESS, risale al 2012 ed è stata realizzata in collaborazione con Ires Piemonte. Il suo scopo era dotare soggetti pubblici non specializzati di strumenti e competenze che consentissero di trattare fondi di dimensioni consistenti.

Il contesto di allora mostrava, almeno nei suoi contorni di base, un consolidamento della tecnologia per la riproduzione digitale di opere a stampa e la loro pubblicazione online su piattaforme interrogabili full-text. Tuttavia, risultava evidente che, mentre digitalizzare grandi fondi a scopo di preservazione era semplice, più complesso era pubblicarli e renderli ricercabili e fruibili online in modo efficace.

L’autentico salto di qualità, in questo campo, stava quindi nella dimensione dei fondi da digitalizzare oltre che nell’ampiezza e nell’efficacia degli strumenti di ricerca che si volevano offrire all’utenza. Le iniziative di pubblicazione di grandi fondi erano ancora relativamente rare, non solo in Italia, ma anche nel resto dell’Europa. Un importante esempio in merito è il progetto Europeana, inaugurato nel 2008 e partito con un solido appoggio politico, un budget significativo, partner qualificati e soluzioni tecniche avanzate. L’architettura progettuale di Europeana, basata sullo sviluppo di un portale federato di diversi archivi/biblioteche online, è un compromesso tra risorse importanti, ma non infinite, e un obiettivo ambizioso. Eppure, già nel 2012, proprio chi aveva maggiormente sostenuto l’iniziativa avanzava dubbi e riconosceva la difficoltà dell’impresa. (…)

L’evoluzione delle tecnologie sembrava promettere che anche le biblioteche con budget contenuti potessero digitalizzare collezioni di grandi dimensioni in tempi rapidi.

BESS (Biblioteca elettronica di scienze sociali ed economiche del Piemonte), gruppo di cooperazione composto da 15 biblioteche e centri di documentazione di enti di ricerca, università e fondazioni, mirava a favorire una maggiore diffusione sul territorio dell’informazione socioeconomica, grazie all’impiego delle nuove tecnologie dell’informazione e della ricerca via internet, incentivando una maggiore collaborazione interbibliotecaria. Data questa premessa, si è scelto di svolgere il lavoro mettendo in rete più partner per raggiungere una massa critica di collezioni, di enti partecipanti, di risorse umane, di competenze e di utenza tale da giustificare l’investimento in un’infrastruttura completa. La scelta poggiava su riflessioni teoriche ed esperienze pregresse, come quelle riportate da Anna Galluzzi in Biblioteche e cooperazione (2004) e sulle osservazioni di Richard Sennett in Together (2012).

La rete adottata faceva perno sul doppio pivot di territorio e disciplina, cioè istituzioni collegate da prossimità geografica e specializzazione comune nell’ambito delle scienze umane. Anche per quanto riguarda la digitalizzazione, la scelta di lavorare per area geografica e per affinità disciplinare ha costituito un vantaggio evidente grazie alla logistica semplificata e alla possibilità di realizzare collezioni online dedicate a un’utenza omogenea con interessi coerenti e con una rete di soggetti che contribuivano a popolare un unico punto di accesso. L’idealtipo di rete a cui il progetto piemontese si è ispirato è quello della Bayerische Landesbibliothek Online, sviluppato dalla Biblioteca di stato della Baviera insieme a una rete di altre biblioteche e istituzioni culturali bavaresi (BESS e Kempf, 2008). Naturalmente, le dimensioni e la dotazione economica del progetto tedesco, garantite da un costante finanziamento pubblico, erano di ordine decisamente maggiore rispetto a DigiBESS, che pure ha potuto contare sul supporto finanziario della Compagnia di San Paolo di Torino per un decennio, in particolare per l’investimento iniziale, ma soprattutto per il sostentamento costante del personale dedicato, impiegato nel laboratorio di digitalizzazione.

L’architettura funzionale del programma piemontese DigiBESS prevedeva un unico centro di digitalizzazione e un unico repository costituiti da un laboratorio di digitalizzazione; hardware e software per il post processing (raddrizzamento, scontornamento e conversione dei formati delle immagini); il riconoscimento ottico dei caratteri e, infine, un repository che utilizzava programmi totalmente open source.

L’appassionante esperienza pionieristica di DigiBESS, le competenze acquisite e l’architettura disegnata hanno consentito la realizzazione di Byterfly, sua naturale evoluzione. Inaugurata dal CNR-IRCrES nel 2017, Byterfly conta attualmente più di 1.700.000 pagine corrispondenti a 14.927 volumi, quasi 12.000 immagini e video. I fornitori di contenuti (provider) sono 25 e le collezioni 99.

I documenti delle collezioni racchiudono un pezzo di storia del pensiero sociale ed economico del Piemonte. Si tratta di volumi appartenenti all’Università di Torino (biblioteca Bobbio e biblioteca di Economia e Management) e della Fondazione Einaudi; periodici del Gruppo Fiat (FGA Automotive) e della Camera di Commercio di Torino. Oltre a queste collezioni, sono presenti documenti del Museo dell’Automobile di Torino; libri d’arte della Fondazione 1563 per Arte e Cultura di Torino; libri antichi di teologia e religione, risalenti ai secoli XVI-XVIII, forniti dall’Ordine dei Minimi di San Francesco di Paola; volumi rari e antichi di scienza e tecnica (dal XVI al XIX secolo), patrimonio del CNR-IRCrES. Inoltre, vi è depositato tutto l’archivio di materiali, libri e immagini del festival musicale internazionale MITO SettembreMusica, organizzato ogni anno a Torino e Milano. Sono altresì presenti collezioni della Fondazione Olivetti, della Fondazione Agnelli, della Fondazione Gramsci, nonché una collezione di bilanci di impresa. I documenti sono in italiano, latino, inglese, francese, spagnolo e tedesco.

Per meglio orientare l’utente, i materiali sono stati raggruppati nella homepage in cinque macro aree:

● 16th – 19th Century Books / Libri antichi (economia, scienza e cristianesimo)

● Economics and Firms reviews / Riviste di economia e impresa

● Modern books on Economics and Social Sciences / Libri moderni di economia e scienze sociali

● Entertainment Newspapers and Media / Periodici e media (sport, musica e svago)

● Journals of social sciences / Riviste di scienze sociali

cms_26112/f1.jpg

Homepage di Byterfly (https://www.byterfly.eu/)

La filosofia che guida la composizione, cioè l’architettura, anche nel senso di struttura tecnica, si riassume nella necessità di preservare, di condividere e di rendere leggibili a video e riutilizzabili documenti di alto interesse nelle scienze umane, sociali ed economiche. Questa linea di pensiero si innesta sulle cinque regole che fondano la scienza biblioteconomica, elaborate da Shiyali Ramamrita Ranganathansu (1892-1972):

● I libri sono fatti per essere usati

● A ogni lettore il suo libro

● A ogni libro il suo lettore

● Risparmia il tempo del lettore

● La biblioteca è un organismo che cresce

Un repository, dunque, è una biblioteca con una collezione di oggetti digitali finalizzati (testi, immagini, file audio e video), memorizzati e combinati con metadati che ne forniscono informazioni e dettagli indispensabili per facilitare la ricerca e la diffusione degli oggetti anche su altri portali.

CNR-IRCrES, con il suo IT Office e la biblioteca, gestisce e manutiene diversi repository dal 2012. Il brand Byterfly è stato implementato come nuovo repository proprio in nome della prima legge della biblioteconomia ossia “I libri sono fatti per essere usati”. Oggi, rendere i libri disponibili a tutti i lettori significa caricarli in un sito online accessibile, raggiungibile e fruibile.

All’origine di Byterfly c’è la scelta di utilizzare il sistema di memorizzazione e gestione degli oggetti digitali Fedora Repository, acronimo di Flexible Extensible Digital Object Repository Architecture e Islandora. I software sono il risultato di un lavoro condiviso nella vasta comunità open-source. In particolare, Fedora Repository è una base astratta che definisce un contesto e delle regole per l’organizzazione di oggetti digitali selezionati, pensati per sistemi di conservazione di opere digitali a lungo termine, in grado di gestire grosse quantità di dati, in modo flessibile, con l’intento di poter trattare i più svariati tipi di item.

Poiché la libertà e la semplicità del rapporto libro-lettore sono elementi cardine di Byterfly, l’interfaccia web verso gli utenti è basata sul CMS (Content Management System) Drupal, uno strumento open source, versatile, aperto e personalizzabile.

Per quanto riguarda la visualizzazione a monitor degli oggetti digitali raccolti in Byterfly, questa è studiata per essere intuitiva, per favorire la libertà della ricerca e la semplicità nel rapporto libro-lettore. Per ottenere ciò, Byterfly si avvale di Islandora, che, tra i vari moduli e componenti, ha realizzato due elementi particolarmente interessanti per il progetto: il viewer e il sistema di ricerca. Il viewer è un componente basato su Internet Archive Bookreader che permette la lettura online dei libri, in una visualizzazione molto realistica. Il titolo è richiamato direttamente dal repository e produce la visualizzazione delle singole pagine di un libro come se fosse aperto sulla scrivania davanti all’utente. Ad ogni pagina corrisponde una trascrizione in caratteri a stampa prodotta dal sistema di riconoscimento ottico dei caratteri (OCR, Optical Character Recognition). Quest’opzione è particolarmente apprezzata se i caratteri del testo originale sono antichi, il che, a volte, rende la lettura meno agevole. Quanto mai utile è offrire la possibilità di ingrandire le immagini per scoprirne maggiori dettagli e di navigare liberamente tra tutte le pagine del volume.

Elemento fondamentale per la fruizione delle risorse in Byterfly è la facilità di ricerca per titoli, autori, soggetti, date. La realizzazione di questa interfaccia intuitiva è il risultato di un processo di indicizzazione e metadatazione attraverso la piattaforma Solr, personalizzata nella configurazione, per ottenere l’indicizzazione full-text dei testi dei volumi e dei metadati. Il risultato permette sia la ricerca per parole chiave nei dati descrittivi delle opere, con possibilità di filtri suggeriti dallo stesso sistema di indicizzazione (facet), sia la ricerca full-text nel contenuto dei libri, che può essere abbinata o utilizzata in alternativa. Per ottenere ciò, i moduli Islandora sono stati adattati per la resa a monitor del risultato della ricerca, cioè le parti di testo contenenti le parole o le parole chiave ricercate appaiono evidenziate e il collegamento alla specifica pagina nel libro risulta attivo.

cms_26112/f2.jpg

Risultato di una ricerca libera esemplificativa. La parola “turin” è reperibile nelle pagine indicate in basso dai link blu (https://www.byterfly.eu/islandora/object/librib%3A623590#mode/2up).

cms_26112/f3.jpg

Risultato di una ricerca libera esemplificativa, così come appare all’interno di un testo. Il termine “carrefour” è evidenziato e immediatamente visibile (https://www.byterfly.eu/islandora/object/librib%3A623590#page/72/mode/2up).

Infine, Byterfly occupa uno spazio significativo all’interno della rete internazionale dei diversi sistemi di cataloghi online, e in particolare in metacataloghi come Europeana e WorldCat grazie all’utilizzo dei protocolli comuni di metadatazione Dublin Core (Dublin Core Metadata Initiative, in acronimo DCMI) e di harvesting che rispondono alle specifiche di entrambi i collettori. WorldCat è la più grande rete mondiale di contenuti e servizi bibliotecari, dove la maggior parte delle persone inizia la sua ricerca di informazioni. Byterfly ha un rapporto diretto con questo metacatalogo e vi condivide direttamente i propri contenuti. Per quanto riguarda Europeana, invece, il rapporto è indiretto, mediato dall’agenzia del Ministero della Cultura, CulturaItaliaOnline, che li riversa periodicamente. Inoltre, Byterfly ha lavorato per permettere la visualizzazione immediata degli oggetti sul portale di Europeana tramite l’innovativo protocollo IIIF, arricchendo quindi la fruizione per l’utente.

cms_26112/f4.jpg

Dal portale Europeana è possibile sfogliare direttamente una risorsa presente in Byterfly https://www.europeana.eu/it/item/668/libria_50653

Byterfly integra informatica e biblioteconomia attraverso un lavoro avvincente e costruttivo, che ha permesso di approfondire tecnologie consolidate e di conoscerne di nuove, sviluppando, coerentemente con la filosofia dalla comunità open source, soluzioni aperte, di facile replica in altri contesti e riutilizzabili eventualmente da altri progetti. Per tale motivo, tutta la documentazione prodotta è disponibile in rete sul sito di sviluppo.

Quando è cominciata quest’avventura nel 2005, come anticipato, non era prevedibile la capacità di penetrazione del web, che a gennaio 2022 si attestava al 62,5% della popolazione mondiale, e neppure era immaginabile il riscontro che avrebbe ottenuto il repository, che oggi conta un numero di accessi e download costante. Per dare un’idea concreta, come si vede nel grafico 1, le visite giornaliere per il periodo 3 marzo 2021 – 3 marzo 2022 si attestano su un livello medio di 1.200 visite giornaliere.

cms_26112/g1.jpg

Visite giornaliere, periodo 3 marzo 2021 – 3 marzo 2022

Dal grafico 2 possiamo ricavare alcuni dati relativi al mese di febbraio 2022 che attestano più di 37.000 visite al sito, con la visualizzazione di 300.000 pagine e lo scarico di 29.000 oggetti (pdf /tiff /txt).

cms_26112/g2.jpg

Riepilogo visite mese di febbraio 2022.

Un altro obiettivo che il gruppo di lavoro persegue consiste nel trovare strade per avvicinare il pubblico alla biblioteca e alle sue risorse attraverso operazioni di divulgazione e proposte di percorsi guidati di lettura, anche coinvolgendo altri soggetti. Fra le proposte sperimentate a livello locale, in stretta collaborazione con il territorio, vi sono l’installazione multimediale Macchingegno, collocata presso l’Ecomuseo del Freidano (Settimo Torinese), e il video Patrimonio culturale, ingegno e tecnologia: dall’energia muscolare all’energia atomica verso l’energia pulita e rinnovabile. Entrambi sono basati su una selezione di testi e immagini di libri antichi e rari di storia della tecnica, patrimonio del CNR-IRCrES. Questi sono stati digitalizzati e resi fruibili nel repository con tre precisi obiettivi: il primo è di permettere la loro lettura e fruizione – eventualmente arricchite con adds multimediali – anche al di fuori dei circuiti privilegiati dell’accademia. Il secondo è quello di contribuire a risolvere i problemi legati alla consultabilità di volumi rari o antichi e le difficoltà relative alla loro reperibilità e dispersione sul territorio. Il terzo obiettivo è quello di superare, con la fruizione online, i problemi relativi all’estrema fragilità di questi materiali bibliografici. Il valore aggiunto dell’operazione è quello di mettere a disposizione del vasto pubblico risorse di grande valore storico, utili per lo sviluppo di una coscienza critica scientifica e storica. Per il mondo del web, invece, è stata aperta la sezione Exhibitions, ossia mostre digitali, ancora in fase di consolidamento, con una prima realizzazione sperimentale su 1919. Cronache dalla Storia: immagini e documenti d’archivio. Dal quotidiano alla voglia di cambiamento. Si tratta di un percorso con documenti selezionati, commentati e valorizzati per offrire all’utente un’esperienza di fruizione guidata all’interno del repository.

Byterfly è un’opera aperta, in continua evoluzione, secondo quanto espresso dalla quinta regola d’oro della biblioteconomia: “una biblioteca è un organismo che cresce”. In quest’ottica è attiva una collaborazione con il “Metropolitan New York Library Council” per lo studio, la realizzazione e lo sviluppo di repository basati su “Archipelago”, architettura moderna per la conservazione e presentazione di oggetti digitali che sicuramente sarà il trampolino per il successivo balzo evolutivo di Byterfly.

Riferimenti bibliografici all’articolo e maggiori approfondimenti sulla Rivista Culture Digitali, anno 2°, numero 4 -marzo/aprile 2022- (https://www.diculther.it/rivista/culture-digitali-anno-2-numero-4-marzo-aprile-2022/)

Redazione

Tags:

Lascia un commento



<<Pagina Precedente | Stampa | Torna Su


News by ADNkronos


Salute by ADNkronos