-
Notifications
You must be signed in to change notification settings - Fork 2
/
picrust2.py
37 lines (29 loc) · 1.92 KB
/
picrust2.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
#PICRUSt2
#Para analisis de perfiles funcionales de microbiota de
#personas con Trastorno Depresivo Mayor (MDD) y Controles Saludables (CS)
#necesitamos 3 archivos: la DADA2.fna (los ASV , metadata.tsv (la tabla de los metadatos) y table.biom
#paso 1: crear una nueva carpeta para poner los objetos de salida de PICRUSt2
mkdir picrust2_out_pipeline
cd picrust2_out_pipeline
#paso 2: colocar las lecturas del ASV en el arbol de referencia
place_seqs.py -s ../DADA2.fna -o out.tre -p 1 \
--intermediate intermediate/place_seqs
#paso 3: predicción del estado oculto de familia de genes
# Este paso es para ver que tan similar es cada ASV a una secuencia de referencia existente
hsp.py -i 16S -t out.tre -o marker_predicted_and_nsti.tsv.gz -p 1 -n # secuencia 16S de referencia más cercana
hsp.py -i EC -t out.tre -o EC_predicted.tsv.gz -p 1 # predice el numero de EC por asv
# Este paso puede tardar dependiendo la capacidad de la computadora (30 horas en una macOS Monterey 12.3.1 - 16 RAM,
# 15 min linux 32 RAM y 7 min linux 128 GB)
#para visualizar las tablas:
zless -S marker_predicted_and_nsti.tsv.gz
#la primera columna es el nombre de los ASV, seguido de el numero previsto de copias de 16S por ASV
#seguido de el valor NSTI (valor del índice de taxón de secuencia más cercana) por ASV.
zless -S EC_predicted.tsv.gz
#Esta tabla muestra el numero de copias previsto de todos los numeros de clasificacion de enzimas
#para casa ASV.
#paso 4: predicción de los metageomas
#Este paso ayuda a pronosticar las familias de genes ponderadas por la abundancia relativa de los ASV de la comunidad
#Por lo que esto se genera conectado la tabla BIOM de abundancias de ASV por muestras
metagenome_pipeline.py -i ../table.biom -m marker_predicted_and_nsti.tsv.gz -f EC_predicted.tsv.gz \
-o EC_metagenome_out --strat_out
#este paso va a generar varios arcihivos de salida, entre ellos: