nf-core / chipseq

GitHub Actions CI StatusGitHub Actions Linting StatusNextflowDOI

install with biocondaDockerGet help on Slack

Introduction

nfcore/chipseq is a bioinformatics analysis pipeline used for Chromatin ImmunopreciPitation sequencing (ChIP-seq) data.

pipeline er bygget ved Hjelp Av Nextflow, et arbeidsflytverktøy for å kjøre oppgaver på tvers av flere databehandlingsinfrastrukturer på en svært bærbar måte. Den leveres med docker containere gjør installasjonen triviell og resultater svært reproduserbar.

pipeline sammendrag

  1. rå lese QC (FastQC)
  2. Adapter trimming (Trim Galore!)
  3. Justering (BWA)
  4. Merk duplikater (picard)
  5. slå sammen justeringer fra flere biblioteker i samme prøve (picard)
    1. merk duplikater på nytt (picard)
    2. filtrering for å fjerne:
      • leser kartlegging til svartelistede områder (SAMtoolsBEDTools)
      • leser som ikke er merket som primære justeringer (SAMtools)

    3. leser som ikke er merket som primære justeringer (SAMtools)
    4. leser som ikke er kartlagt (SAMtools)
    5. leser som inneholder >4 mismatches (BAMTools)
    6. leser som har en innsatsstørrelse>2kb (BAMTools; bare sammenkoblet ende)
    7. leser det kartet til forskjellige kromosomer (Pysam; kun sammenkoblet ende)
    8. leser det arent i fr-orientering (Pysam; kun sammenkoblet ende)
    9. leser der bare en leser AV DEN par mislykkes kriteriene ovenfor (Pysam; Qc Og estimering av bibliotekets kompleksitet (picardPreseq)
    10. Opprett normaliserte bigWig-filer skalert til 1 million kartlagte leser (BEDToolsbedGraphToBigWig)
    11. generer genkroppsmetaprofil fra bigwig-filer (deepTools)
    12. beregn trådkorrelasjonstopp og chip-seq kvalitetsmål inkludert nsc og rsc (phantompeakqualtools)
    13. Ring brede/smale topper (MACS2)
    14. Kommenter topper i forhold til genfunksjoner (HOMER)
    15. Opprett konsensusstopp på tvers av alle prøver og opprett tabellfil for å hjelpe til med filtrering av dataene (BEDTools)
    16. teller leser i konsensustopper (featureCounts)
    17. Differensial bindende analyse, Pca og clustering (RDESeq2) li>
  6. lag igv session fil som inneholder bigwig spor, topper og differensial nettsteder for datavisualisering (IGV).
  7. Presentere QC for rå lese, justering, topp-ringer og differensial bindende resultater (MultiQCR)

Hurtigstart

  1. Installernextflow

  2. installer entenDocker ellerSingularity for full reproduserbarhet av rørledningen (bruk bareConda som en siste utvei; se dokumenter)

  3. last ned rørledningen og test den på et minimalt datasett med en enkelt kommando:

    nextflow run nf-core/chipseq -profile test,<docker/singularity/conda/institute>

    sjekk nf-core / configs for å se om det allerede finnes en tilpasset konfigurasjonsfil for å kjøre nf-core pipelines for Instituttet ditt. I så fall kan du bare bruke -profile <institute> i kommandoen din. Dette vil aktivere enten dockereller singularity og angi de riktige kjøringsinnstillingene for ditt lokale databehandlingsmiljø.

  4. begynn å kjøre din egen analyse!

    nextflow run nf-core/chipseq -profile <docker/singularity/conda/institute> --input design.csv --genome GRCh37

Se bruksdokumenter for alle tilgjengelige alternativer når du kjører rørledningen.

Dokumentasjon

nf-core / chipseq rørledningen kommer med dokumentasjon om rørledningen, funnet idocs/ katalogen:

  1. Installasjon
  2. Pipeline configuration
  3. Lokal installasjon
  4. Legge til ditt eget system config
  5. Referanse genomer
  6. Kjøre pipeline
  7. Utgang Og hvordan du tolker resultatene
  8. Feilsøking

Credits

disse skriptene ble opprinnelig skrevet Av Chuan Wang (@chuan-wang) og phil ewels (@ewels) for bruk ved national genomics infrastructure på scilifelab i stockholm, sverige. Rørledningen har siden blitt re-implementert Av Harshil Patel (@drpatelh) fra Bioinformatikk & Biostatistics Group Ved Francis Crick Institute, London.Mange takk til andre som har hjulpet og bidratt underveis også, inkludert (men ikke begrenset til): @apeltzer, @bc2zb, @crickbabs, @drejom, @houghtos, @KevinMenden, @mashehu, @pditommaso, @Rotholandus, @sofiahaglund, @tiagochst og @winni2k.

Bidrag og Støtte

Hvis du vil bidra til denne rørledningen, se bidragende retningslinjer.

for ytterligere informasjon eller hjelp, ikke nøl med å ta kontakt på Slack #chipseq kanal (du kan bli med denne invitasjonen).

Citation

hvis du bruker nf-core / chipseq for analysen din, vennligst oppgi den ved hjelp av følgende doi: 10.5281/zenodo.3240506

du kan sitere nf-core publikasjonen som følger:

en omfattende liste over referanser for verktøyene som brukes av rørledningen finnes iCITATIONS.md fil.

nf-kjernerammen for fellesskapskuraterte bioinformatikkledninger.

Philip Ewels, Alexander Peltzer, Sven Fillinger, Harshil Patel, Johannes Alneberg, Andreas Wilm, Maxime Ulysse Garcia, Paolo Di Tommaso & Sven Nahnsen.

Nat Biotechnol. 2020 Feb 13. doi: 10.1038/s41587-020-0439-x.
ReadCube: Full Access Link

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.