Introduction
nfcore/chipseq is a bioinformatics analysis pipeline used for Chromatin ImmunopreciPitation sequencing (ChIP-seq) data.
putki on rakennettu käyttäen nextflow-työnkulkutyökalua, jolla voidaan suorittaa tehtäviä useissa laskentainfrastruktuureissa hyvin kannettavalla tavalla. Sen mukana tulee satamakontteja, jotka tekevät asennuksesta triviaalia ja tulokset erittäin toistettavissa.
putkiston Yhteenveto
- Raakalukema QC (
FastQC
) - sovittimen leikkaus (
Trim Galore!
) - tasaus (
BWA
) - merkitse kaksoiskappaleet (
picard
) - yhdistä saman otoksen useista kirjastoista tehdyt täsmennykset (
picard
)- merkitse kaksoiskappaleet uudelleen (
picard
) - suodatus poistaa:
- lukee kartoituksen mustalle listalle joutuneille alueille (
SAMtools
BEDTools
) - lukee, että arent on merkitty kahdennetuiksi (
SAMtools
) - lukee, että arent on merkitty ensisijaisiksi alangoiksi (
SAMtools
) - lukee, jotka ovat rajaamattomia (
SAMtools
) - lukee, että kartta on moneen paikkaan (
SAMtools
) - lukee, jotka sisältävät > 4 yhteensopimatonta (
BAMTools
) - lukee, että on inserttikoko > 2kb (
BAMTools
; vain pariloppuinen) - lukee kartan eri kromosomeihin (
Pysam
; vain pariloppuinen) - lukee, että arent Fr-orientaatiossa (
Pysam
; vain pariloppuinen) - lukee, missä vain yksi luetaan pari ei täytä edellä mainittuja kriteerejä (
Pysam
; vain pareittain)
- lukee kartoituksen mustalle listalle joutuneille alueille (
- tasaus-tason QC ja kirjaston monimutkaisuuden arviointi (
picard
Preseq
) - luo normalisoituja bigWig-tiedostoja, jotka skaalautuvat 1 miljoonaan kartoitettuun lukemaan (
BEDTools
bedGraphToBigWig
) - luo geeniruumiin metaprofiili BigWig-tiedostoista (
deepTools
) - laske genomin laajuinen IP-rikastus suhteessa kontrolliin (
deepTools
) - laske säikeiden ristikorrelaatiohuippu ja chip-seq-laatumittarit mukaan lukien NSC ja RSC (
phantompeakqualtools
) - Soita laajoja/kapeita piikkejä (
MACS2
) - merkitse piikit suhteessa geenien ominaisuuksiin (
HOMER
) - luo konsensuspiikit kaikille näytteille ja luo taulukkotiedosto helpottamaan tietojen suodattamista (
BEDTools
) - lukema lukee konsensushuipuissa (
featureCounts
) - differentiaalinen Sidonta-analyysi, PCA ja ryhmittely (
R
DESeq2
)
- merkitse kaksoiskappaleet uudelleen (
- luo IGV-istuntotiedosto, joka sisältää bigwig-kappaleita, huippuja ja differentiaalisivustoja tietojen visualisointiin (
IGV
). - esittää QC: n raakalukuun, kohdistukseen, huippukutsuun ja differentiaaliseen sidontatulokseen (
MultiQC
R
)
Quick Start
-
Asenna joko
Docker
taiSingularity
täyden putkiston uusittavaksi (käytä vainConda
viimeisenä keinona; katso dokumentit) -
lataa putkisto ja testaa se minimaalisella aineistolla yhdellä komento:
nextflow run nf-core/chipseq -profile test,<docker/singularity/conda/institute>
tarkista NF-core / configs nähdäksesi, onko Laitoksellasi jo mukautettu asetustiedosto NF-core-putkistojen ajamiseen. Jos näin on, voit käyttää
-profile <institute>
komennossasi. Tämä mahdollistaa jokodocker
taisingularity
ja asettaa sopivat suoritusasetukset paikalliseen laskentaympäristöön. -
aloita oman analyysin suorittaminen!
nextflow run nf-core/chipseq -profile <docker/singularity/conda/institute> --input design.csv --genome GRCh37
Installnextflow
katso käyttöasiakirjoista kaikki mahdolliset vaihtoehdot putkistoa ajettaessa.
Documentation
the nf-core / chipseq pipeline come with documentation about the pipeline, found in the docs/
directory:
Paikallisinstallaatio
lähtö ja tulosten tulkitseminen
Krediitit
nämä skriptit on alun perin kirjoittanut Chuan Wang (@chuan-Wang) ja Phil ewels (@ewels) käytettäväksi kansallisessa genomiikan infrastruktuurissa scilifelabissa Tukholmassa, ruotsissa. Putken on sittemmin toteuttanut uudelleen Harshil Patel (@drpatelh) bioinformatiikan & biostatistiikan ryhmästä Francis Crick-instituutissa Lontoossa.
Many thanks to other who have helped out and contributed along the way too, including (but not limited to): @apeltzer, @bc2zb, @crickbabs, @drejom, @houghtos, @KevinMenden, @mashehu, @pditommaso, @Rotholandus, @sofiahaglund, @tiagochst ja @winni2k.
Contributions and Support
If you would like to contribute tämän putken, katso avustavat ohjeet.
Jos haluat lisätietoja tai apua, älä epäröi ottaa yhteyttä Slack #chipseq
– kanavalle (voit liittyä tähän kutsuun).
lainaus
Jos käytät analyysissasi nf-core/chipseqiä, mainitse se seuraavalla doi: 10.5281 / zenodo.3240506
voit siteerata nf-core
julkaisua seuraavasti:
laaja luettelo putkiston käyttämistä työkaluista löytyy CITATIONS.md
tiedostosta.
the NF-core framework for community-curated bioinformatics pipels.
Philip Ewels, Alexander Peltzer, Sven Fillinger, Harshil Patel, Johannes Alneberg, Andreas Wilm, Maxime Ulysse Garcia, Paolo Di Tommaso & Sven Nahnsen.
Nat Biotechnol. 2020 Feb 13. doi: 10.1038/s41587-020-0439-x.
ReadCube: Full Access Link