Skip to content

Adele-Desmazieres/Pasteur-superkmers

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 

Repository files navigation

Superkmers

Principe

Ce projet consiste à regrouper des sous-séquences successives d'ADN ensemble en superkmers, pour permettre d'en rechercher des fragments plus rapidement.

Pour cela, on parcourt une séquence ADN en entrée (fichier .fasta). On crée toutes les sous-séquences de taille k (qui se chevauchent), appelées k-mers. Puis on crée toutes les sous-séquences des k-mers de taille m, appelées m-mers. On appelle "minimiseur d'un k-mer" son m-mer le plus petit, dans l'ordre alphabétique (A>C>G>T).

Enfin on regroupe les k-mers successifs qui ont le même minimiseur ensemble, formant ainsi les superkmers.

Utilisation

Compilation

gcc -Wall main.c -o main -lm

Exécution

Le programme prend en argument :

  • file.fasta : un chemin vers un fichier en format fasta, contenant la séquence ADN à analyser
  • directory : un chemin vers le répertoire où sera créé le fichier de sortie avec la liste des superkmers
  • k : la taille des k-mers, comprise entre 1 et 31
  • m : la taille des m-mers, comprise entre 1 et k
./main file.fasta directory k m

Par exemple :

./main data/ecoli.fasta out/ 31 13

Contact

Adèle DESMAZIERES [email protected]

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages