Tareas.txt

TAREAS

Para Jesús: 

1)	. Scar plot aa vs dm con tamaño de punto proporcional a número de scanes
	. Sacar heatmap que indique en cada posición del péptido el número de cada tipo de modificacion
	. Sacar mapa para analizar Z de pgm2p, p2qf y qf2q a lo largo de toda la proteína


Para Multiómica:

1) Machine learning usando PESA y AWHS
2) Aplicar MOFA a AWHS
	- Factor 2 de MOFA-PESA: Sacar heatmap, metabolitos más asociados y combinar con grafo de rCCA
	  ver qué features son las más conectadas con estas proteínas.

	- En el report, en la parte relativa a MOFA, basta con señalar las correlaciones globales
	  que detecta el modelo. Presencia de apolipoproteínas, complemento e inmunoglobulinas
	  en los factores más asociados a condición caso/control o FHS y asociación lípidos como
 	  TG, DAG u otros. PESA y AWHS son datos muy distintos, así que no debemos buscar una 
	  validación rígida sino coincidencias y complementariedad.

---------

1) 	Análisis de grafo en PESA
	. En combinación con análisis de factores, analizar grafo, subgrafos y aplicar
	  ideas de WGCNA.

* Continuar análisis de grafo:
	- Pretenencia de cada feature a su cluster por correlación
	- Analizar conexiones entre clústeres usando la hipergeométrica. (otra posibilidad es densidad de conexiones)
	  Puede ser que esto sea una prueba de la asocación de proteínas y metabolitos (parar aquí?)

	- En pyvis, color aristas según subgrafo de procedencia
	- Analizar nodos con valores altos en métricas locales (degree, betwenness, cercanía...)
	- Comparar nº de cliqués y componentes conexas con los grafos aleatorios (no es tan importante)


2)	Análisis de factores y grafo en AWHS siguiendo esquema de PESA

3)	ALDH4 lo tenemos paralizado. Al retomarlo es preciso:
	. Lanzar CMM con features filtradas (hemos cambiado el criterio del ANOVA)!!!
	. Lanzar TurboP con anotaciones de CMM

4)	. ALDH4: Crear una tabla f2i con anotaciones de metabolitos
	  combinando los que dio Alessia y los sacados de TP. (Estos últimos los menos seguros)
	-> Para ALDH4 tenemos un problema: Perdemos features identificadas por Alessia y del paper:
		- Al eliminar features que tienen más de un missing value en alguno de los grupos
		- Filtrar por ANOVA: Esto lo hemos cambiado, si lo perdemos, es que no es relevante...

*** Los puntos 3 y 4 de ALDH4 los dejamos en stand-by hasta que solucionemos el asunto,
hay bastante por hacer en PESA AWHS...


* El análisis y WF sobre ALDH4 se presenta como un ejemplo en tejido donde es preciso aplicar
  un tipo de feature selection y que muestra que se puede trabajar con muestras más pequeñas
  y metadatos más sencillos.