1 of 21

Lucie Khamvongsa-Charbonnier exemple

  • Contexte scientifique : ( qu'est-ce que fait le script)
    • type de données, taille des données, nombre
    • Analyse de données RNA-seq humain & autres
    • Cancer
  • Etat des lieux : (description)
    • écrit en bash (Slurm, Job array)
    • 6 étapes
  • Objectif de session travail de mercredi :
    • Snakemake (réécriture)
    • fonctionne sur cluster IFB
    • Profil slurm

1

2 of 21

Besseau Samuel

  • Contexte scientifique : ( qu'est-ce que fait le script)
  • Etat des lieux : (description)
  • Objectif de session travail de mercredi :

2

3 of 21

Bessoltane Nadia

  • Contexte scientifique : ( qu'est-ce que fait le script)
    • Benchmark_params_star : trouver la combinaison de paramètres optimale pour l’alignement de données RNAseq d’une espèce hexaploïde, polyploïde…
    • tester diff paramètres d’alignement “star”
    • QC
    • (pipeline snakemake d’analyse WGS/WES -> détection de SNV/InDels/SV)
  • Etat des lieux : (description)
    • écrit en shell
  • Objectif de session travail de mercredi :
    • output en dossiers imbriqués
    • me familiariser avec l’utilisation de checkpoint
    • (optimisation des ressources : espace, mémoire…)

3

4 of 21

Carpentier Marie-Christine (Nextflow)

  • Contexte scientifique : ( qu'est-ce que fait le script)
    • Pipeline RNASeq chez Arabidopsis thaliana
    • Actuellement juste étape mapping et sort.bam
    • 1 échantillon à la volée

  • Etat des lieux : (description)
    • Script bash pour un cluster PBS run
    • Pour tous les ech., boucle for qui lance le qsub

  • Objectif de session travail de mercredi :
    • Migrer l’étape du pipeline sous Nextflow
    • Si y a le temps, ajouter les autres étapes avant avec trimming et après avec comptages et analyse sous R

4

5 of 21

Chassagnol Bastien

  • Contexte scientifique : ( qu'est-ce que fait le script)
    • Written in Nextflow (in general improve the script)
    • https://github.com/omnideconv/deconvBench/blame/main/pipeline/main.nf: streamline the comparison and benchmark of cellular deconvolution algorithms
    • Tool for benchmarking study of second-generation deconvolution methods.
  • Etat des lieux : (description)
    • use of shell motor, apparently it’s better to use script
  • Objectif de session travail de mercredi :
    • Make it available for the IFB-core cluster
    • Improve modularity, by using dedicated configuration files for resource materials (for the moment, only one big main Nextflow file)
    • Possibly update or identify deprecated methods
    • Overall, adhere to the Institut Curie Geniac standards

5

6 of 21

COGNAT Valérie

  • Contexte scientifique : ( qu'est-ce que fait le script)
    • Assemblage de génomes bactériens
    • Short reads / hybrid ou long reads
    • Utilisation de plusieurs assembleurs / statistiques globales
  • Etat des lieux : (description)
    • workflow snakemake v8
  • Objectif de session travail de mercredi :
    • voir avec le groupe snakemake quelques points bloquants (checkpoint, schemas, gestion des erreurs)
    • adapter une partie du workflow en nextflow pour évaluer si netxflow serait plus adapté sur des gros workflows (gestion de conditions)

6

7 of 21

EL KHADDAR Fadwa (Nextflow)

  • Contexte scientifique :

Génération d'index Reindeer à partir d'une liste de fichiers fastq en utilisant Nextflow

  • Etat des lieux : (description)
    • Téléchargement des fichiers SRA à partir de la base de donnée SRA ncbi et génération de l’index Reindeer utilisé pour la recherche des séquences.
  • Objectif de session travail de mercredi :
    • Dans le pipeline Snakemake, j’utilise parallel-fastq-dump qui a besoin d’un certains nombre de threads “chunk” pour télécharger rapidement les fichiers fastq, quand je lance “snakemake –cores $nb_core” , la règle de parallel-fastq-dump prend ce paramètre $nb_core et non pas le nombre de threads défini dans la règle. “J’aimerais savoir si je peux trouver une solution pour ça sur Nextflow”
    • Paralléliser mieux le traitement des données

7

8 of 21

Fall Sidy

  • Contexte scientifique : ( qu'est-ce que fait le script)
  • Etat des lieux : (description)
  • Objectif de session travail de mercredi :

8

9 of 21

Goulet Lindsay

  • Contexte scientifique : ( qu'est-ce que fait le script)
  • Etat des lieux : (description)
  • Objectif de session travail de mercredi :

9

10 of 21

GUIGON Isabelle

  • Contexte scientifique : ( qu'est-ce que fait le script)
    • Donnnées : fichier fasta ou taxid ou identifiants de génome (bactériens)
    • Récupération de métadonnées concernant les génomes
    • Lancement d’un logiciel de recherche de clusters de gènes
    • Création de divers résumés en TSV (scripts Python)
  • Etat des lieux : (description)
    • Pipeline écrit en Nextflow
    • 10 Process
  • Objectif de session travail de mercredi :
    • Amélioration du pipeline (ça marche mais certaines étapes sont vraiment moches)

10

11 of 21

Héligon Christophe

  • Contexte scientifique : ( qu'est-ce que fait le script)
    • DL from www + Transforms to rdf/owl (conda)
    • creates SPARQL endpoint (docker)
    • performs SPARQL queries → graphs (docker)
    • performs graph embedding/classifiers training (conda)
    • performs predictions (conda)
  • Etat des lieux : (description)
    • Multiple parameters to test (algo/batchsize/graph_type)
    • !!! SPARQL steps cannot be run in parallel
    • python/sparql/bash
    • (bad) snakemake version exists for local use
  • Objectif de session travail de mercredi :
    • Create nextflow script
    • and/or rework snakemake script to make it good
    • use apptainer/singularity instead of conda/docker
    • Make it usable on slurm

11

12 of 21

Hinsinger Damien

  • Contexte scientifique : Traitement des données issues de séquençage NAS
    • démultiplexage / filtres
    • mapping
    • assembly / filtres
    • statistiques
  • Etat des lieux : (description)
    • un launcher qui appelle les scripts de job (équivalent au snakefile)
    • manuel par le créateur (doctorant)
  • Objectif de session travail de mercredi :
    • passage à Snakemake

12

13 of 21

JOB Bastien

  • Contexte scientifique : ( qu'est-ce que fait le script)
    • NEXTFLOW
    • Analyse de variations de nombre de copies génomiques (CNA) sur données issues de shWGS (shallow whole genome sequencing) à l’aide de l’outil (R) ichorCNA
    • Start : FASTQ single end
    • End : profil CNA
    • Application : données humaines (mais le pipeline n’a pas forcément à être limité à cette espèce)
    • Linéaire et mono-échantillon
  • Etat des lieux : (description)
    • Gros script bash immonde rempli de boucles de sbatch --wrap
    • Etat des lieux des modules existants (à priori toutes les étapes sauf un sous-outil Picard)
  • Objectif de session travail de mercredi :
    • Amorcer l’enchaînement des étapes : chargement données, QC (fastQC, fastq_screen, multiQC), trimming (fastp), trim QC (fastQC, multiQC), mapping, duplicates marking, QC (samtools, mosdepth, multiQC), ichorCNA.
    • Apprendre à gérer les dépendances des outils (liste adaptateurs Illumina, FASTA, indexes, wig de mappabilité / GC% , Panel of Normals, …)
    • Avoir quelques hints conceptuels sur l’utilisation sous plusieurs modes (avec ou sans PoN, génération du PoN, …)

13

14 of 21

Lalam Samuel

  • Contexte scientifique : ( qu'est-ce que fait le script)
    • génomique comparative à partir de proteome
  • Etat des lieux : (description)
    • idée de la pipeline avec plusieurs outils potentiels, encore non déterminés
  • Objectif de session travail de mercredi :
    • avoir une ébauche d’un nextflow sur les étapes principales de la pipeline.

14

15 of 21

Petit Aurélien

  • Contexte scientifique : ( qu'est-ce que fait le script)
    • Assemblage de données nanopore
    • Utilise plusieurs outils pour : assembly, polishing, scaffolding
    • raw data -> 2 assemblages
  • Etat des lieux : (description)
    • 4 étapes par assembleur
    • Gros script bash
  • Objectif de session travail de mercredi :
    • Faire l’architecture de la traduction en snakemake

15

16 of 21

Plassard Damien

  • Contexte scientifique : ( qu'est-ce que fait le script)
  • Etat des lieux : (description)
  • Objectif de session travail de mercredi :

16

17 of 21

Poirot Olivier

  • Contexte scientifique : ( qu'est-ce que fait le script)
    • Lancement d’une recherche blast sur un db splitée sur plusieurs noeuds

  • Etat des lieux : (description)
    • Un ensemble de noeuds dispose d’1 portion de la db
    • Le script lance le blast de la query sur chaque noeud
    • Gestion du cas d’un noeud qui ne répondrait pas, un noeud de secours doit lancer le blast manquant (redondance de chaque noeud ou envoi dynamique de la sous-db manquante)
  • Objectif de session travail de mercredi :
    • Ecriture du script…

17

18 of 21

Robin Vivian

  • Contexte scientifique : ( qu'est-ce que fait le script)
    • Pipeline to call and annotate somatic copy-number alterations (CNAs) starting from BAM files of aligned reads
  • Etat des lieux : (description)

    • nf-core sarek has released figures on these tools and we'd like to compare them with our snakemake pipeline that we're currently building.
    • snakemake workflow created

  • Objectif de session travail de mercredi :
    • Add CNVKit or ASCAT tool in pipeline snakemake
    • Use a wrappers (https://github.com/etal/cnvkit, https://github.com/VanLoo-lab/ascat )

18

19 of 21

Rousseau Jérémy

  • Contexte scientifique : ( qu'est-ce que fait le script)
    • Téléchargement de la banque de données CATH / Gene3d (profil HMM)
    • Input : séquences fasta (plusieurs fichiers)
    • Recherche des profils HMM avec hmmsearch
  • Etat des lieux : (description)
    • scripts bash disponible
    • outils disponible dans des conteneurs singularity
  • Objectif de session travail de mercredi :
    • écrire le pipeline : nextflow
    • utilisation avec slurm

19

20 of 21

YOUNSI Lilia

  • Contexte scientifique : ( qu'est-ce que fait le script)
  • Etat des lieux : (description)
  • Objectif de session travail de mercredi :

20

21 of 21

  • Contexte scientifique : ( qu'est-ce que fait le script)
  • Etat des lieux : (description)
  • Objectif de session travail de mercredi :

21