nf-core / chipseq

GitHub Actions CI StatusGitHub Actions Linting StatusNextflowDOI

install with biocondaDockerGet help on Slack

Introduction

nfcore/chipseq is a bioinformatics analysis pipeline used for Chromatin ImmunopreciPitation sequencing (ChIP-seq) data.

rörledningen är byggd med Nextflow, ett arbetsflödesverktyg för att köra uppgifter över flera beräkningsinfrastrukturer på ett mycket bärbart sätt. Den levereras med docker behållare gör installationen trivial och resultat mycket reproducerbara.

pipeline sammanfattning

  1. Raw läsa QC (FastQC)
  2. adapter trimning (Trim Galore!)
  3. justering (BWA)
  4. markera dubbletter (picard)
  5. sammanfoga anpassningar från flera bibliotek i samma prov (picard)
    1. markera dubbletter igen (picard)
    2. filtrering för att ta bort:
      • läser kartläggning till svartlistade regioner (SAMtoolsBEDTools)
      • läser som är markerade som dubbletter (SAMtools)
      • läser som inte är markerade som primära inriktningar (SAMtools)
      • läser som är omappade (SAMtools)
      • läser den kartan till flera platser (SAMtools)
      • läser som innehåller > 4 mismatches (BAMTools)
      • läser som har en insatsstorlek > 2KB (BAMTools; endast paired-end)
      • läser den kartan till olika kromosomer (Pysam; endast paired-end)
      • läser den arent i FR-orientering (Pysam; endast paired-end)
      • läser där endast en läsning av par misslyckas med ovanstående kriterier (Pysam; QC och uppskattning av bibliotekets komplexitet (picardPreseq)
      • skapa normaliserade bigWig-filer skalade till 1 miljon mappade läsningar (BEDToolsbedGraphToBigWig)
      • generera genkroppsmetaprofil från bigwig-filer (deepTools)
      • beräkna genomomfattande IP-anrikning i förhållande till kontroll (deepTools)
      • beräkna strängkorskorrelationstopp och chip-seq kvalitetsåtgärder inklusive NSC och RSC (phantompeakqualtools)
      • Ring breda/smala toppar (MACS2)
      • kommentera toppar i förhållande till genfunktioner (HOMER)
      • skapa konsensus peakset över alla prover och skapa tabellfil för att underlätta filtrering av data (BEDTools)
      • räkna läser i konsensus toppar (featureCounts)
      • Differentialbindningsanalys, PCA och kluster (RDESeq2)
  6. skapa IGV-sessionsfil som innehåller bigwig-spår, toppar och differentiella platser för datavisualisering (IGV).
  7. nuvarande QC för raw-läsning, justering, toppsamtal och differentialbindningsresultat (MultiQCR)

Snabbstart

  1. Installeranextflow

  2. installera antingenDocker ellerSingularity för full pipeline Reproducerbarhet (använd endastConda som en sista utväg, se dokument)

  3. ladda ner pipeline och testa den på en minimal dataset med ett enda kommando:

    nextflow run nf-core/chipseq -profile test,<docker/singularity/conda/institute>

    kontrollera nf-core/configs för att se om en anpassad konfigurationsfil för att köra NF-core pipelines redan finns för ditt institut. Om så är fallet kan du helt enkelt använda -profile <institute> I ditt kommando. Detta aktiverar antingen docker eller singularity och ställer in lämpliga exekveringsinställningar för din lokala beräkningsmiljö.

  4. börja köra din egen analys!

    nextflow run nf-core/chipseq -profile <docker/singularity/conda/institute> --input design.csv --genome GRCh37

se användardokument för alla tillgängliga alternativ när du kör rörledningen.

dokumentation

NF-core/chipseq-rörledningen levereras med dokumentation om rörledningen, som finns i katalogendocs/ :

  1. Installation
  2. pipeline configuration
    • lokal installation
    • lägga till din egen systemkonfiguration
    • Referensgenom
  3. kör pipeline
  4. utgång och hur man tolkar resultaten
  5. felsökning

krediter

dessa skript skrevs ursprungligen av Chuan Wang (@chuan-Wang) och Phil ewels (@ewels) för användning vid National Genomics infrastructure på SciLifeLab i Stockholm. Rörledningen har sedan dess genomförts på nytt av Harshil Patel (@drpatelh) från Bioinformatics & Biostatistics Group vid Francis Crick Institute, London.

stort tack till andra som har hjälpt till och bidragit på vägen också, inklusive (men inte begränsat till): @apeltzer, @bc2zb, @crickbabs, @drejom, @houghtos, @KevinMenden, @mashehu, @pditommaso, @Rotholandus, @sofiahaglund, @tiagochst och @winni2k.

bidrag och stöd

Om du vill bidra till denna pipeline, se de bidragande riktlinjerna.

För ytterligare information eller hjälp, tveka inte att kontakta Slack #chipseq kanal (du kan gå med i denna inbjudan).

Citation

Om du använder nf-core/chipseq för din analys, vänligen citera den med följande doi: 10.5281 / zenodo.3240506

Du kan citera publikationennf-core enligt följande:

en omfattande lista med referenser för de verktyg som används av rörledningen finns i filenCITATIONS.md.

NF-core-ramverket för community-curated bioinformatics pipelines.

Philip Ewels, Alexander Peltzer, Sven Fillinger, Harshil Patel, Johannes Alneberg, Andreas Wilm, Maxime Ulysse Garcia, Paolo Di Tommaso & Sven Nahnsen.

Nat Biotechnol. 2020 Feb 13. doi: 10.1038/s41587-020-0439-x.
ReadCube: Full Access Link

Lämna ett svar

Din e-postadress kommer inte publiceras.