nf-core / chipseq

GitHub Actions CI StatusGitHub Actions Linting StatusNextflowDOI

install with biocondaDockerGet help on Slack

Introduction

nfcore/chipseq is a bioinformatics analysis pipeline used for Chromatin ImmunopreciPitation sequencing (ChIP-seq) data.

putki on rakennettu käyttäen nextflow-työnkulkutyökalua, jolla voidaan suorittaa tehtäviä useissa laskentainfrastruktuureissa hyvin kannettavalla tavalla. Sen mukana tulee satamakontteja, jotka tekevät asennuksesta triviaalia ja tulokset erittäin toistettavissa.

putkiston Yhteenveto

  1. Raakalukema QC (FastQC)
  2. sovittimen leikkaus (Trim Galore!)
  3. tasaus (BWA)
  4. merkitse kaksoiskappaleet (picard)
  5. yhdistä saman otoksen useista kirjastoista tehdyt täsmennykset (picard)
    1. merkitse kaksoiskappaleet uudelleen (picard)
    2. suodatus poistaa:
      • lukee kartoituksen mustalle listalle joutuneille alueille (SAMtoolsBEDTools)
      • lukee, että arent on merkitty kahdennetuiksi (SAMtools)
      • lukee, että arent on merkitty ensisijaisiksi alangoiksi (SAMtools)
      • lukee, jotka ovat rajaamattomia (SAMtools)
      • lukee, että kartta on moneen paikkaan (SAMtools)
      • lukee, jotka sisältävät > 4 yhteensopimatonta (BAMTools)
      • lukee, että on inserttikoko > 2kb (BAMTools; vain pariloppuinen)
      • lukee kartan eri kromosomeihin (Pysam; vain pariloppuinen)
      • lukee, että arent Fr-orientaatiossa (Pysam; vain pariloppuinen)
      • lukee, missä vain yksi luetaan pari ei täytä edellä mainittuja kriteerejä (Pysam; vain pareittain)
    3. tasaus-tason QC ja kirjaston monimutkaisuuden arviointi (picardPreseq)
    4. luo normalisoituja bigWig-tiedostoja, jotka skaalautuvat 1 miljoonaan kartoitettuun lukemaan (BEDToolsbedGraphToBigWig)
    5. luo geeniruumiin metaprofiili BigWig-tiedostoista (deepTools)
    6. laske genomin laajuinen IP-rikastus suhteessa kontrolliin (deepTools)
    7. laske säikeiden ristikorrelaatiohuippu ja chip-seq-laatumittarit mukaan lukien NSC ja RSC (phantompeakqualtools)
    8. Soita laajoja/kapeita piikkejä (MACS2)
    9. merkitse piikit suhteessa geenien ominaisuuksiin (HOMER)
    10. luo konsensuspiikit kaikille näytteille ja luo taulukkotiedosto helpottamaan tietojen suodattamista (BEDTools)
    11. lukema lukee konsensushuipuissa (featureCounts)
    12. differentiaalinen Sidonta-analyysi, PCA ja ryhmittely (RDESeq2)
  6. luo IGV-istuntotiedosto, joka sisältää bigwig-kappaleita, huippuja ja differentiaalisivustoja tietojen visualisointiin (IGV).
  7. esittää QC: n raakalukuun, kohdistukseen, huippukutsuun ja differentiaaliseen sidontatulokseen (MultiQCR)

Quick Start

    Installnextflow

  1. Asenna jokoDockertaiSingularitytäyden putkiston uusittavaksi (käytä vainCondaviimeisenä keinona; katso dokumentit)

  2. lataa putkisto ja testaa se minimaalisella aineistolla yhdellä komento:

    nextflow run nf-core/chipseq -profile test,<docker/singularity/conda/institute>

    tarkista NF-core / configs nähdäksesi, onko Laitoksellasi jo mukautettu asetustiedosto NF-core-putkistojen ajamiseen. Jos näin on, voit käyttää -profile <institute> komennossasi. Tämä mahdollistaa joko docker tai singularity ja asettaa sopivat suoritusasetukset paikalliseen laskentaympäristöön.

  3. aloita oman analyysin suorittaminen!

    nextflow run nf-core/chipseq -profile <docker/singularity/conda/institute> --input design.csv --genome GRCh37

katso käyttöasiakirjoista kaikki mahdolliset vaihtoehdot putkistoa ajettaessa.

Documentation

the nf-core / chipseq pipeline come with documentation about the pipeline, found in the docs/ directory:

  • installaatio
  • Paikallisinstallaatio

  • Oman järjestelmäkonfiguraation lisääminen
  • Viitegenomit
  • putkijohdon juokseminen
  • lähtö ja tulosten tulkitseminen

  • vianmääritys
  • Krediitit

    nämä skriptit on alun perin kirjoittanut Chuan Wang (@chuan-Wang) ja Phil ewels (@ewels) käytettäväksi kansallisessa genomiikan infrastruktuurissa scilifelabissa Tukholmassa, ruotsissa. Putken on sittemmin toteuttanut uudelleen Harshil Patel (@drpatelh) bioinformatiikan & biostatistiikan ryhmästä Francis Crick-instituutissa Lontoossa.

    Many thanks to other who have helped out and contributed along the way too, including (but not limited to): @apeltzer, @bc2zb, @crickbabs, @drejom, @houghtos, @KevinMenden, @mashehu, @pditommaso, @Rotholandus, @sofiahaglund, @tiagochst ja @winni2k.

    Contributions and Support

    If you would like to contribute tämän putken, katso avustavat ohjeet.

    Jos haluat lisätietoja tai apua, älä epäröi ottaa yhteyttä Slack #chipseq – kanavalle (voit liittyä tähän kutsuun).

    lainaus

    Jos käytät analyysissasi nf-core/chipseqiä, mainitse se seuraavalla doi: 10.5281 / zenodo.3240506

    voit siteerata nf-core julkaisua seuraavasti:

    laaja luettelo putkiston käyttämistä työkaluista löytyy CITATIONS.md tiedostosta.

    the NF-core framework for community-curated bioinformatics pipels.

    Philip Ewels, Alexander Peltzer, Sven Fillinger, Harshil Patel, Johannes Alneberg, Andreas Wilm, Maxime Ulysse Garcia, Paolo Di Tommaso & Sven Nahnsen.

    Nat Biotechnol. 2020 Feb 13. doi: 10.1038/s41587-020-0439-x.
    ReadCube: Full Access Link

    Vastaa

    Sähköpostiosoitettasi ei julkaista.