|
La franja horaria es GMT +2. Ahora son las 04:04. |
|
#1
|
||||
|
||||
|
SIMAP (Similarity Matrix of Proteins) Link equipo TitanesDC: ACERCA DE SIMAP ¿Qué es SIMAP? SIMAP es una base de datos de similitud de proteínas que contiene casi todas las secuencias proteicas publicadas y está en continua actualización. Las similitud de proteínas es establecida mediante el algoritmo FASTA, el cual proporciona una rapidez y sensibilidad óptimas. SIMAP es, por lo que sabemos, el único proyecto que combina una extensa cobertura de las proteínas conocidas con capacidad de actualización incremental. ¿Cúal es la utilidad de SIMAP? Debido a la inmensa cantidad de secuencias de proteínas en las bases de datos de dominio público, es obvio que en un futuro cercano la mayoría de ellas no podrán ser caracterizadas experimentalmente. Sin embargo, se ha observado que proteínas que han evolucionado directamente a partir de un ancestro común (los llamados ortólogos) tienden a compartir las mismas funciones. Por lo tanto, es posible inferir la función de una proteína que no haya sido caracterizada a partir de uno de sus ortólogos del que ya se conozca su función. Un ejemplo bien conocido son las investigaciones realizadas en genes y proteínas de ratón, cuyos resultados son en muchos casos extrapolables a sus genes y proteínas homólogas en humanos. La similitud entre proteínas proporciona información sobre las relaciones entre éstas y es necesaria para la predicción de ortólogos. Sin embargo, además del algoritmo FASTA, hay otros muchos métodos bioinformáticos que se basan en la similitud entre secuencias proteicas por lo que SIMAP también proporciona otros datos de similitud precomputables con el fin de representar el espacio conocido de cada proteína. Esta estrategia ofrece una nueva y eficiente perspectiva en comparación con el método usado normalmente que implica recalcular repetidamente este tipo de datos. SIMAP se actualiza regularmente por incremento de la matriz de similitud cada vez que aparece una nueva secuencia. El uso de SIMAP es totalmente gratis para fines educativos y de investigación pública. ¿Por qué el proyecto SIMAP necesita computación distribuida? Los costes computacionales para calcular la similitud de proteínas son proporcionales al cuadrado del número de secuencias contenidas por lo que el esfuerzo computacional para mantener la matriz actualizada está en aumento constante. Nuestros recursos internos, con los que se han generado los cálculos para SIMAP en los últimos años, ya no son suficientes para afrontar el volumen actual de secuencias disponibles. Por ello, hemos puesto en práctica un cliente SIMAP para la plataforma BOINC (Berkeley Open Infrastructure for Network Computing) con el que detectar similitudes de secuencia mediante el algoritmo FASTA. ¿Qué instituciones están implicadas en SIMAP? SIMAP es un proyecto conjunto del Centro de Investigación de la Salud y el Medio Ambiente GSF de Neuherberg y del Centro de Ciencias de la Vida y Tecnología de los Alimentos Weihenstephan de la Universidad Técnica de Munich (ambos en Alemania). Persona de contacto: Thomas Rattei (Departamento de Bioinformática orientada al Genoma, TU Munich). Translation by Blanca Perez-Revuelta (Laboratory for Alzheimer's and Parkinson's Disease Research, LMU München) and Antonio Martin (TU München) Source: http://boinc.bio.wzw.tum.de/boincsimap/
__________________
![]() Última edición por cube; 02-May-2009 a las 23:09 |
![]() |
| Herramientas | |
| Desplegado | |
|
|
|