Sistema integrato di editing e produzione
per dizionari e banche dati strutturate




Prima fase (una tantum)
ACQUISIZIONE E STRUTTURAZIONE DELLA BANCA DATI

• Acquisizione della banca dati esistente (dai file utilizzati più di recente: Microsoft Word, Quark XPress, Adobe InDesign, Corel Ventura, Advent 3b2 ...).

• In casi particolari, acquisizione a scanner dei testi composti o da file di altri sistemi obsoleti di composizione.

• Conversione dei dati in una banca dati testuale (in formato Xml).

• Strutturazione della banca dati:

– conversione dalla formattazione tipografica alla marcatura logica;

– di concerto con autori o redattori, aggiunta di marcature logiche su base semantica o sintattica.

Il risultato di questa fase è un file Xml Utf-8 a struttura gerarchica validato da un Dtd ben formato.

• Se il materiale originale è già di tipo Xml, vengono effettuate unicamente le verifiche strutturali e di validazione necessarie per le fasi successive.

• Progetto delle gabbie grafiche/tipografiche per la visualizzazione della versione a stampa e delle interfacce digitali.


La scelta di utilizzare come contenitore delle banche dati testuali file di testo strutturati (Xml) piuttosto che file di database a struttura predefinita (Access, Oracle ecc.) deriva dalla flessibilità di marcatura e strutturazione disponibile: tale flessibilità è necessaria in particolare nel caso di banche dati lessicografiche, in cui ogni record (ogni lemma) deve poter estendere la marcatura gerarchica con modalità non definibili a priori. La gestione del file Xml (parsing, sorting, estrazioni, verifiche) viene effettuata tramite script Java e Awk dedicati. La creazione di strumenti di editing operanti sullo stesso formato in modalità grafica permette di superare le difficoltà tradizionali dell'editing in modalità testuale (diretta) dei file Xml a struttura complessa.

Inoltre, il formato Xml consente modifiche strutturali in corso d’opera in modo trasparente per gli utenti. Il formato Xml è anche un formato universale di interscambio e i file possono essere utilizzati direttamente in tutte le fasi produttive (impaginazione, creazione delle versioni digitali).

Fogli elettronici e file di database a struttura fissa possono essere usati per banche dati a struttura più semplice, anche se preferiamo sempre passare attraverso un formato Xml per poter beneficiare delle migliori possibilità offerte.


Seconda fase
CREAZIONE DEGLI STRUMENTI DI EDITING E SUPPORTO

• L’editing utente è supportato su piattaforme Windows, Macintosh e Linux.

• Generazione di file editabili in modo semplice da autori e redattori, con mantenimento della marcatura logica graficamente evidenziata (formato editabile OpenOffice/NewOffice Writer). La creazione di un file per ogni voce, ospitati da un server comune, permette l’editing concorrente dei collaboratori.

• Generazione di una versione digitale interrogabile (con motore di ricerca edPan) e con accesso diretto da ogni lemma al file editabile corrispondente; questa versione può essere aggiornata durante lavori di lunga durata.

• Supporto ad autori e redattori:

– installazione delle connessioni necessarie al server che ospita la banca dati editabile e definizione delle procedure di backup;

– installazione di una versione modificata di OpenOffice/NewOffice orientata all’editing dello specifico database;

– installazione della versione digitale interrogabile con accesso al database;

– operazioni di parsing per l’estrazione dal database di sottoinsiemi da sottoporre a redazione dedicata;

– elaborazioni globali, eseguibili in modo automatico o semiautomatico prima del ciclo di editing e quindi verificabili in fase di editing;

– costruzione di un foglio elettronico (Microsoft Excel o OpenOffice/ NewOffice Calc) con il lemmario dell’opera corredato da indicazioni statistiche e sensibili di estrazione, anch’esso attivo verso i file editabili.

• L’utente ha sempre a disposizione la collaborazione dello staff di Edigeo, per un supporto dedicato sul fronte informatico, grafico o di produzione; se richiesta, è disponibile anche la collaborazione sul fronte lessicografico.


Terza fase
EDITING DA PARTE DI AUTORI E REDATTORI

Autori e redattori possono lavorare e aggiornare il database avvantaggiandosi di:

– un potente strumento di ricerca avanzata messo a disposizione da un motore dedicato;

– la facilità d’uso di un software di editing Word-like;

– il supporto di una squadra di professionisti per trattamenti o editing particolari.


Quarta fase

RECUPERO DELLA BANCA DATI DOPO L’EDITING

• Alla fine del ciclo di editing, ricostruzione e validazione del file Xml, che costituisce l’unica fonte per tutti i successivi passi di produzione.

• Verifiche formali di base (ordinamento, abbreviazioni, numerazioni ecc.) e altre su indicazioni di autori e redattori.

• Impaginazione semiautomatica a partire dal file Xml finale e generazione di bozze integrali o parziali (solo voci modificate).

L’uso di Advent (APP) 3b2 come software di impaginazione consente una completa programmazione ed editing di tutte le caratteristiche dello stylesheet, modifiche globali sull’intero volume (per una finalizzazione istantanea di foliazione, formato ecc.) e gestione di file Xml separati come sorgente del testo.

• Generazione del beta della versione digitale rich-client (per la distribuzione su cdrom o il download dal sito).

• Generazione del beta della versione digitale online.

Al di fuori di speciali necessità di verifiche e trattamenti, queste operazioni possono prendere da una a due settimane per una banca dati estesa come quella di un grande dizionario monolingue o bilingue.


Quinta fase
PRODUZIONE

Dopo la verifica delle bozze e dei beta e l’inserimento delle correzioni nel database Xml:

• Impaginazione finale e produzione di Pdf certificati per la stampa.

• Generazione del master finale dell’applicazione rich-client per la duplicazione del cdrom.

• Generazione delle versioni finali (3 piattaforme, 32/64 bit) dell’applicazione per il download dal sito eLexico.com.

• Generazione della versione finale dell’applicazione online e montaggio sul sito eLexico.com.

• Ripresa della Seconda fase a partire dai file Xml pubblicati e preparazione dei dati per l’edizione successiva.