Entradas populares

lunes, 11 de octubre de 2010

Descripción y funcionamiento del algortimo BLAST

 A continuación presentamos una descripción del algoritmo de alineamiento BLAST junto con sus etapas, vale la pena decir que este es el algoritmo de mayor uso en la actualidad para este fin.

BLAST (Basic Local Alignment Search Tool) Es un programa de alineamiento de secuencias. El alineamiento de secuencias en bioinformatica es la forma en que se puede representar un par o mas secuencias o cadenas de ADN, ARN o estructura primarias proteicas.

BLAST fue desarrollado por Stephen Altschul, Warren Gish, David Lipman en el centro nacional de informacion  Biotecnologica (NCBI)Webb Millar en la Universidad estatal de Pennsylvania, y Gene Myers en la Universidad de Arizona.


                                             COMO FUNCIONA BLAST


Para ejecutarse, BLAST requiere dos secuencias como entrada, la primera  es la secuencia  de consulta y la segunda en una secuencia de la base de datos. BLAST encontrará subsecuencias en la consulta que son similares a subsecuencias de la base de datos. En el uso típico, la secuencia de consulta es mucho mas pequeña que el banco de datos, por ejemplo, la consulta puede ser de mil nucleótidos mientras que la base de datos es de varios miles de millones de nucleótidos.


BLAST basado en un enfoque heuristico (sistema capaz de realizar innovaciones inmediatas positivas para sus fines) busca alineamientos de secuencias con un alto puntaje y asi poderse acercarse mas al rango del objetivo.

                                                  
                                                EJECUCION DE BLAST



En una primera etapa  BLAST  busca coincidencias exactas de una longitud fija entre la secuencia de consulta y la secuencias de la base de datos. Por ejemplo, dadas las secuencias AGTTAC y ACTTAG y el largo de palabra W = 3, BLAST podría identificar la subcadena coincidente TTA que es común en ambas secuencias.  


En la segunda BLAST ya establecida la semilla se extiende en ambas direcciones. El  proceso de alineamiento busca incrementar su puntaje, una de los riesgos que son mas problables en esta etapa es que BLAST se quede en un  maximo local, es decir que aparentemente sea el mayor valor que puede encontrar pero que en realidad no lo sea.


En la tercera etapa una vez ya terminada su etapa de extension, el programa elimina los alineamientos incosistentes  y posteriomente calcula la puntuacion final de los alineamientos resultante y determina estadisticamente que tan cercano a  la respuesta exacta se encuentra.

4 comentarios:

  1. Jorge Ramirez: Analizando el algoritmo blast y nuestro tema fasta, ya me puedo dar cuenta por que se afirma blasta es mas rapido que fasta, y es debido a que solo maneja tres etapas mientras fasta maneja 4, claro que esto tambien afirma que el algoritmo fasta es mas minucioso a la hora de realizar la busqueda mientras que blast con su velocidad no es tan minucioso, pero pienso que el uso del algoritmo dependera siempre de la base de datos que se use y saber claramente que se desea encontrar y con exactitud.

    ResponderEliminar
  2. Los algoritmos de acuerdo al comentario de Jorge, lo descrito en BLAST y el resultado de la investigación de T-COFFEE, son de una complejidad muy alta, ya que el análisis de cada cadena tiene un costo computacional muy alto, aquí es donde a futuro se debe comenzar a atacar, buscando cual de los procesos es el más complejo para poder optimizar y reducir el impacto que tiene sobre el tiempo de respuesta.

    ResponderEliminar
  3. Pues el hecho de que BLAST trabaje con una heuristica ayuda a que la carga computacional dismuya.

    ResponderEliminar
  4. Si desean utilizar Blast para buscar un peptido es necesario tener en cuenta que este tiene un
    limite inferior sobre la longitud que puede tener una palabra, para el caso de los nucleotidos
    el limite inferior es de 7, si se compara con Fasta este ganara ya que este tiene un
    limite inferior de 1.

    ResponderEliminar