[Crac-bugs] Utilisation de CRAC

Caroline Menguy cbelser at genoscope.cns.fr
Lun 27 Mai 15:37:40 CEST 2013


Bonjour Mikael,

Merci pour toutes ces indications.
Le test sur les 104M de reads pairés est en cours sur une machine à 1T.
Pour le test à 1M, il y a 13 808 jonctions dans le fichier coverlessSplice.
Mais je t'enverrais tout le détail des résultats dès que j'aurais tout.
Cordialement,
Caroline

-----Message d'origine-----
De : Mikaël Salson [mailto:mikael.salson at lifl.fr] 
Envoyé : vendredi 24 mai 2013 18:37
À : caroline.belser at genoscope.cns.fr
Cc : crac-bugs
Objet : Utilisation de CRAC

Bonjour Caroline,

Je reviens vers toi par rapport aux résultats que tu nous as présentés sur
CRAC.
Je t'avoue être un peu étonné sachant que nous avons fait des tests
similaires sur des données humaines (qui sont dans l'article) et Nicolas m'a
dit qu'il en avait aussi fait sur la souris.

J'ai donc pensé à certains aspects qui pourraient éventuellement poser
problème.
– Il y a, on en a parlé, le fait que les positions commencent à 0 dans notre
format maison – Il y a aussi le fait que le jeu de données étant composé de
1M de reads, il se peut qu'un certain nombre de jonctions aient une
couverture très faible (c'est-à-dire vues dans un seul read). Dans ce cas,
ils sont enregistrés dans le fichier dont l'extension est (par défaut)
coverlessSplice (ils apparaissent également dans le SAM), et qu'on peut
récupérer avec l'option --weak-splice.
– Troisième aspect : les jonctions qui sont vues sur le brin -. Je ne me
souviens jamais comment il faut les interpréter dans le fichier des splices,
j'ai donc vérifié :
Si on a
1075 single 1|-1,876686 pos_junction=94 gap_length=829 1|-1,876626
pos_location=134
La localisation donnée pour le splice est toujours la position de fin de
l'exon en 5' (qu'on soit sur le brin + ou sur le brin -). Donc ici un exon
se termine en 876686 et un autre exon reprend 829+1 nucléotides plus loin.

Comme tu m'as posé des questions sur le format maison, tu pourras trouver
une documentation disponible ici :
http://crac.gforge.inria.fr/data/uploads/homemadeoutput.pdf
Et sur le format SAM (nous ajoutons des champs supplémentaires, par rapport
à ceux obligatoires) :
http://crac.gforge.inria.fr/data/uploads/sam.pdf

Je ne sais pas si tu as eu l'occasion de tester CRAC sur une machine
possédant plus de mémoire. Si jamais ça ne marche toujours pas sur le jeu
complet de reads, n'hésite pas à nous envoyer la ligne de commande utilisée
et l'ensemble des messages qui sont affichés par CRAC.
Si besoin, tu peux aussi mettre les jeux de données sur un serveur pour
qu'on puisse tester de notre côté.

N'hésite pas pour toute question,
Mikaël




More information about the Crac-bugs mailing list