-
Notifications
You must be signed in to change notification settings - Fork 0
/
Tareas.txt
61 lines (40 loc) · 2.62 KB
/
Tareas.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
TAREAS
Para Jesús:
1) . Scar plot aa vs dm con tamaño de punto proporcional a número de scanes
. Sacar heatmap que indique en cada posición del péptido el número de cada tipo de modificacion
. Sacar mapa para analizar Z de pgm2p, p2qf y qf2q a lo largo de toda la proteína
Para Multiómica:
1) Machine learning usando PESA y AWHS
2) Aplicar MOFA a AWHS
- Factor 2 de MOFA-PESA: Sacar heatmap, metabolitos más asociados y combinar con grafo de rCCA
ver qué features son las más conectadas con estas proteínas.
- En el report, en la parte relativa a MOFA, basta con señalar las correlaciones globales
que detecta el modelo. Presencia de apolipoproteínas, complemento e inmunoglobulinas
en los factores más asociados a condición caso/control o FHS y asociación lípidos como
TG, DAG u otros. PESA y AWHS son datos muy distintos, así que no debemos buscar una
validación rígida sino coincidencias y complementariedad.
---------
1) Análisis de grafo en PESA
. En combinación con análisis de factores, analizar grafo, subgrafos y aplicar
ideas de WGCNA.
* Continuar análisis de grafo:
- Pretenencia de cada feature a su cluster por correlación
- Analizar conexiones entre clústeres usando la hipergeométrica. (otra posibilidad es densidad de conexiones)
Puede ser que esto sea una prueba de la asocación de proteínas y metabolitos (parar aquí?)
- En pyvis, color aristas según subgrafo de procedencia
- Analizar nodos con valores altos en métricas locales (degree, betwenness, cercanía...)
- Comparar nº de cliqués y componentes conexas con los grafos aleatorios (no es tan importante)
2) Análisis de factores y grafo en AWHS siguiendo esquema de PESA
3) ALDH4 lo tenemos paralizado. Al retomarlo es preciso:
. Lanzar CMM con features filtradas (hemos cambiado el criterio del ANOVA)!!!
. Lanzar TurboP con anotaciones de CMM
4) . ALDH4: Crear una tabla f2i con anotaciones de metabolitos
combinando los que dio Alessia y los sacados de TP. (Estos últimos los menos seguros)
-> Para ALDH4 tenemos un problema: Perdemos features identificadas por Alessia y del paper:
- Al eliminar features que tienen más de un missing value en alguno de los grupos
- Filtrar por ANOVA: Esto lo hemos cambiado, si lo perdemos, es que no es relevante...
*** Los puntos 3 y 4 de ALDH4 los dejamos en stand-by hasta que solucionemos el asunto,
hay bastante por hacer en PESA AWHS...
* El análisis y WF sobre ALDH4 se presenta como un ejemplo en tejido donde es preciso aplicar
un tipo de feature selection y que muestra que se puede trabajar con muestras más pequeñas
y metadatos más sencillos.