Analysing Non-Desired Output Data from High Throughput Sequencers for the Identification of the Source of Contamination

University essay from KTH/Proteinvetenskap

Abstract: High-throughput Sequencing (HTS)-tekniker fortsätter att utvecklas snabbt, vilket ökar genomströmningen och minskar sannolikheten för fel. MGI Tech Co., Ltd. (MGI) är ett ledande HTS-varumärke som använder DNBSEQ-teknologi och finns i Center for Translational Microbiome (CTMR). MGI:s sequencers har en hög känslighet och det är viktigt att följa protokollen när proverna hanteras för att undvika introduktion av kontaminering. Detta projekt kommer att utforska tidigare genererade data vid CTMR för att fastställa hur och var i sekvenseringsprocessen kontaminering har introducerats. Data delas in i två huvudkategorier: primärdata, eller verkliga data (RD), och sekundära data, vidare uppdelad i Never Used Barcodes (NUB) och Non-Sequenced (NS). RD:n är sann mot provet, medan NUB och NS anses vara hämtade från bakgrundsbrus. RD, NUB och NS var föremål för taxonomiska analyser, på släkt- och artnivå, och streckkodsanalyser med hjälp av RStudio-gränssnittet för att identifiera och kontrastera de vanligaste i varje kategori. Dessutom var RD också föremål för dekontamineringsanalys på två databaser, VaMyGyn och KOLBIBAKT. Dekontaminering används för att identifiera förorenande arter i ett samhälle. Efter analysen fanns det inga starka bevis som tydde på laboratoriekontamination eller kontaminerade reagenser. Några av dessa NUB delade subsekvenser med RD barcodes, där antal reads för varje par var korrelerade mellan prover. Det kan vara en indikation på att RD barcoded med sekvenseringsfel blir inkorrekt tolkade som NUB. En djupare analys skulle krävas för att bekräfta det.CTMR är numera medveten om att kontaminering från laboratoriet, reagenser eller manipulation inte är orsaken till hämtning av bakgrundsljud.

  AT THIS PAGE YOU CAN DOWNLOAD THE WHOLE ESSAY. (follow the link to the next page)