L'objectif de ce projet est de mesurer le biais de fractionnement entre les choromosomes homologues de Malus domestica. Le génome de Prunus persica sert de référence pour la comparaison interchromosomique de Malus domestica.
The goal of this project is to measure the fractionation biais between homologous chromosomes of Malus domestica. Prunus persica genome is the reference for the interchomosomic comparison of Malus domestica.
- Python 3.9.2
- numpy 1.23.1
- pandas 1.4.3
- plotly 5.9.0
- plotly.express 0.4.1
- scipy 1.8.1
- i-ADHoRe 3.0.01
- blastp 2.11.0
Télécharger le projet Genome Fractionation Biais - IRHS dans votre espace de stockage local.
Copier ce projet de votre espace de stockage local sur le cluster de calcul.
scp -r [path/to/]genome-fractionation-biais [user]@[cluster]:~
Création d'un environnement i-ADHoRe 3 grâce à conda.
conda create -c thiesgehrmann -c bioconda -c conda-forge -n iadhore_env iadhore
Dans le dossier data :
- un dossier MD_lst contenant :
- la liste des gènes de Malus domestica, sous la forme
Md01.lst
,Md02.lst
, ...Md17.lst
- la liste des gènes de Malus domestica, sous la forme
- un dossie PP_lst contenant :
- la liste des gènes de Prunus persica, sous la forme
Pp01.lst
,Pp02.lst
, ...Pp08.lst
- la liste des gènes de Prunus persica, sous la forme
- le protéome de Malus domestica au format .fasta avec le nom
Malus-domestica-prot.fasta
- le protéome de Prunus persica au format .fasta avec le nom
Prunus-persica-prot.fasta
- éventuellement le génomes de Malus domestica au format .fasta avec le nom
Malus-domestica-nucl.fasta
- éventuellement le génomes de Prunus persica au format .fasta avec le nom
Prunus-persica-nucl.fasta
- Dans un terminal, se connecter au serveur de calcul par ssh.
ssh cluster-irhs.angers-nantes.inrae.fr
- Déplacer le répertoire courant dans le dossier genome-fractionation-biais.
cd [path/to/]genome-fractionation-biais
- Activer l'environnement virtuel avec i-ADHoRe.
conda activate iadhore_env
- Créer l'arborescence de dossiers.
mkdir "data" "log"
-
Enregistrer les input files dans le dossier data.
-
Lancer le programme.
./main.sh
- bis. Lancer le programme sur les génomes plutôt que les protéomes :
./main.sh -n
Les résultats sont dans le dossier results/python/.
Les résultats intermédiaires sont dans database/, results/blast/ et results/iadhore/.
Le premier lancement prendra du temps, notamment pendant le blast. Lors des lancements suivants, le programme ne réalisera pas les tâches qu'il à déjà faites, sauf si les fichiers de résultats sont supprimés, ou si une option est passée pour forcer leur rééxecution.
Afficher les options disponibles :
./main.sh -h
Forcer la réexécution de toutes les tâches :
./main.sh -a
Forcer la réexécution de certaines tâches avec -b -i -p ou n'importe quelle combinaison des trois :
./main.sh -b # makeblastdb et blast
./main.sh -i # iadhore
./main.sh -p # python
Adèle DESMAZIERES