Università Cattolica del Sacro Cuore Millennium Unicatt DocTA DocTA DocTA  

DocTA - Doctoral Theses Archive >
Tesi di dottorato >
SCUOLA DI DOTTORATO IN SISTEMA AGRO-ALIMENTARE >

Citation:
Please use this identifier to cite or link to this item:
Lamontanara, Antonella. "DEVELOPMENT AND APPLICATION OF BIOINFORMATICS PIPELINES FOR NEXT GENERATION SEQUENCING DATA ANALYSIS", Università Cattolica del Sacro Cuore, XXVI ciclo, a.a. 2013/14, Piacenza, [http://hdl.handle.net/10280/6068].

Title: DEVELOPMENT AND APPLICATION OF BIOINFORMATICS PIPELINES FOR NEXT GENERATION SEQUENCING DATA ANALYSIS
Author: LAMONTANARA, ANTONELLA
Tutor: MAROCCO, ADRIANO
CATTIVELLI, LUIGI
ORRU', LUIGI
Supervisor: ALBANESE, ANTONIO
Language: ENG
Italian Abstract: Lo sviluppo delle tecnologie di sequenziamento ha portato alla nascita di strumenti in grado di produrre gigabasi di dati di sequenziamento in una singola corsa. Queste tecnologie, comunemente indicate come Next Generation Sequencing o NGS, producono grandi e complessi dataset la cui analisi comporta diversi problemi a livello bioinformatico. L'analisi di questo tipo di dati richiede la messa a punto di pipelines computazionali il cui sviluppo richiede un lavoro di scripting necessario per concatenare i softwares già esistenti. Questa tesi tratta l'aspetto metodologico dell'analisi di dati NGS ottenuti con tecnologia Illumina. In particolare in essa sono state sviluppate tre pipelines bioinformatiche applicate ai seguenti casi studio: 1) uno studio di espressione genica mediante RNA-seq in "Olea europaea" finalizzato all’indagine dei meccanismi molecolari alla base dell’acclimatazione al freddo in questa specie; 2) uno studio mediante RNA-seq finalizzato all’identificazione dei polimorfismi di sequenza nel trascrittoma di due razze bovine mirato a produrre un ampio catalogo di marcatori di tipo SNPs; 3) il sequenziamento, l’assemblaggio e l’annotazione del genoma di un ceppo di Lactobacillus plantarum che mostrava potenziali proprietà probiotiche.
English Abstract: The advance in sequencing technologies has led to the birth of sequencing platforms able to produce gigabases of sequencing data in a single run. These technologies commonly referred to as Next Generation Sequencing or NGS produce millions of short sequences called “reads” generating large and complex datasets that pose several challenges for Bioinformatics. The analysis of large omics dataset require the development of bioinformatics pipelines that are the organization of the bioinformatics tools in computational chains in which the output of one analysis is the input of the subsequent analysis. A work of scripting is needed to chain together a group of existing software tools.This thesis deals with the methodological aspect of the data analysis in NGS sequencing performed with the Illumina technology. In this thesis three bioinformatics pipelines were developed.to the following cases of study: 1) a global transcriptome profiling of “Oleaeuropeae” during cold acclimation, aimed to unravel the molecular mechanisms of cold acclimation in this species; 2) a SNPs profiling in the transcriptome of two cattle breeds aimed to produce an extensive catalogue of SNPs; 3) the genome sequencing, the assembly and annotation of the genome of a Lactobacillus plantarum strain showing probiotic properties.
Defense Date: 28-Jan-2015
URI: http://hdl.handle.net/10280/6068
Appears in Collections:SCUOLA DI DOTTORATO IN SISTEMA AGRO-ALIMENTARE

Files in This Item:

File SizeFormatFull-text availability
Thesis_Lamontanara_A.pdf974,88 kBAdobe PDFunder embargo


Access and Use of Materials in DocTA




 

DocTA è un servizio dell'Università Cattolica del Sacro Cuore realizzato in collaborazione con CINECA
© 2011 UCSC - Tutti i diritti riservati - Powered by DSpace Software - Feedback