Información

¿Puede pymol mostrar dibujos animados (estructura secundaria) para un pdb de varios fotogramas?


estoy usandopymolpara visualizar la estructura secundaria de la proteína utilizando sudibujos animadosrepresentación. lospdbEl archivo proviene de una simulación, que contiene varios fotogramas. Después de cargar elpdb, su estructura secundaria (por ejemplo, hoja, hélice) no pudo ser reconocida. Sorprendentemente, si solo se mantiene un marco, se puede ver su estructura secundaria. Entonces, ¿cómo habilitar el reconocimiento de estructuras secundarias para unpdbarchivo con varios marcos?

Un ejemplo delpdbarchivo con varios marcos se muestra a continuación.

COMENTARIO GENERADO POR TRJCONV TÍTULO Proteína en agua t = 0.00000 OBSERVACIÓN ESTA ES UNA CAJA DE SIMULACIÓN CRYST1 116.453 116.453 116.453 90.00 90.00 90.00 P 1 1 MODELO 1 ATOM 1 N ASP 1 85.582 59.777 48.367 1.000.0000 N ATOM 2 H1 ASP 1 84.882 59.067 48.507 1.000 .0000 H ATOM 3 H2 ASP 1 85.162 60.617 48.747 1.000.0000 H… ATOM 6615 OT ALA 442 28.032 36.877 69.157 1.000.0000 O ATOM 6616 O ALA 442 30.092 36.087 68.677 1.000.0000 O ATOM 6617 HO ALA 442 30.072 35.867 69.597 1.000. 0000 H TER ENDMDL COMENTARIO GENERADO POR TRJCONV TÍTULO Proteína en agua t = 1000.00000 COMENTARIO ESTA ES UNA CAJA DE SIMULACIÓN CRYST1 116.384 116.384 116.384 90.00 90.00 90.00 P 1 1 MODELO 2 ATOM 1 N ASP 1 75.052 41.097 56.132 1.000.0000 N ATOM 2 H1 ASP 1 75.622 41.407 55.352 1.000.0000 H ATOM 3 H2 ASP 1 75.602 41.357 56.932 1.000.0000 H ATOM 4 H3 ASP 1 74.682 40.167 56.272 1.000.0000 H ATOM 5 CA ASP 1 74.032 42.157 56.202 1.000.0000 C… ATOM 6615 OT ALA 442 45.292 49.247 90.922 1.000.0000 O ATOM 6616 O ALA 442 47.102 49.617 89.632 1.000.0000 O ATOM 6617 HO ALA 442 47.662 49.327 90.342 1.000.0000 H TER ENDMDL


Parece que si noHÉLICEregistro está presente en el PDB, PyMol intenta asignar la estructura secundaria él mismo. Por el motivo que sea, no hace esto si variosMODELOs están presentes. Debería poder utilizar el dss comando para obligar a PyMol a calcular la estructura secundaria en un PDB con múltiplesMODELOs.


Como estoy obsesionado con la actina y las proteínas que se unen a la actina, usaré el complejo de actina con profilina para esta demostración. Profilin actúa como un factor de intercambio de ATP para G-actina. Los monómeros de actina "viejos" de los filamentos de actina despolimerizados recientemente tienen ADP unido a ellos y, al unirse a la profilina, intercambiarán el ADP por ATP. Encontré una estructura agradable (determinada por difracción de rayos X) de actina unida a profilina en el sitio web de RSCB Protein Data Bank. Abra PyMol y escriba lo siguiente en la línea de comando de Pymol:

Extraemos las distintas partes del complejo con las que queremos trabajar.

Obtenga el script de residuos de la interfaz e identifique los residuos que interactúan

Vaya al sitio web del script InterfaceResidues y desplácese hacia abajo en la página hasta llegar al cuadro El código. Copie el código y péguelo en un nuevo archivo de texto que denomine InterfaceResidues.py. Asegúrese de utilizar un editor de texto sin formato y guarde los archivos como texto sin formato para que no se incluyan caracteres ocultos o extraños en el archivo. Mi editor de texto gratuito favorito es TextWrangler. Aunque guarde el archivo como texto sin formato, asegúrese de que la extensión del archivo sea .py y no .txt. Guarde el script en su directorio de trabajo de PyMOL.

El script InterfaceResidues se basa en las proteínas que interactúan y tienen cadenas etiquetadas como A y B. Verifique que el complejo tenga las etiquetas de cadena correctas.

Debido a que las cadenas no se nombran A y B, tengo que crear un complejo con las 2 cadenas para usar el script InterfaceResidues. Ejecute el script, cree el complejo e identifique los residuos que interactúan.

El script creará una selección llamada (interfaz) que contiene los residuos de la interfaz.


Más visualización con VMD y amp PyMOL

Como continuación del tutorial anterior, le mostraré algunas cosas más que puede hacer con VMD junto con algunos trucos para PyMOL. Usaremos un modelo para el anclaje de fosfopanteteína de las proteínas transportadoras de acilo. Esta correa protésica forma un enlace tioéster con los aminoácidos y los entrega a los sitios activos de muchas enzimas diferentes que se encuentran más comúnmente en las vías biosintéticas de los productos naturales.

Sin embargo, todo lo que realmente necesita saber es que es la molécula de ejemplo con la que trabajaremos hoy, y puede descargar las coordenadas que usaremos para la visualización aquí y aquí.

Revisión de VMD: trayectorias, taquiones y más.

Ahora, hay algunos detalles de VMD que no conocimos la última vez que son útiles para obtener figuras más descriptivas de sus archivos de coordenadas con VMD. Comience abriendo el archivo PPant-Anim.xyz en VMD. Cuando abra este archivo, notará que contiene más de un conjunto de coordenadas. Puede ver las diferentes coordenadas deslizando hacia adelante y hacia atrás la barra en la parte inferior de la ventana principal de VMD. Notarás que las diferentes estructuras no están alineadas de ninguna manera.

A continuación, se explica cómo alinear estructuras en VMD.
Vaya a la herramienta de trayectoria Extensions & gtAnalysis & gtRMSD y verá una ventana similar a esta:

elementos, la columna vertebral de una proteína, y utilizan expresiones que excluyen ciertos elementos o índices. Ahora que hemos alineado las estructuras, cuando usamos la barra en la ventana principal de VMD, podemos ver que las estructuras son todas iguales en el extremo fosfo de la molécula.

Cómo visualizar todas las estructuras al mismo tiempo:

En VMD, también podemos superponer todas las diferentes estructuras de nuestra trayectoria al mismo tiempo. Vaya a Graphics & gtRepresentations y seleccione la pestaña Trayectoria. Como hay 15 fotogramas numerados del 0 al 14 y queremos verlos todos, escribiremos 0:14 en el cuadro de diálogo Dibujar varios fotogramas.

Ahora podemos volver a la pestaña Estilo de dibujo y elegir el método de coloración como Paso de tiempo. El degradado de color por defecto es rojo / blanco / azul. Puede elegir una opción alternativa yendo a Graphics & gtColors y eligiendo la pestaña Color Scale (de hecho, usaré rojo / verde / azul hoy con un desplazamiento de 0.30 para hacer los colores más claros). En cuanto al resto de los ajustes, consulte el tutorial anterior para activar la oclusión ambiental, configurar el material para que se difunda y el método de dibujo como CPK con Sphere Scale / Bond Scale 1.6 y 1.0.

Ahora, el resultado de nuestro renderizado puede diferir mucho según el renderizador que usemos. Para dar una apariencia suave que enfatice la profundidad, podemos usar Tachyon con un material difuso. Esto casi replica el renderizado similar al de Qutemol, pero querrás jugar con los colores que usas. Para mostrar más claramente las diferencias entre los dos motores de renderizado, observe la siguiente escena renderizada con Tachyon (izquierda) y POV-Ray (derecha):


Tenga en cuenta que otra técnica útil para visualizar con VMD es asignar diferentes materiales a diferentes elementos o selecciones. Podemos cambiar los átomos seleccionados en representaciones para nuestro representante de CPK a "Todos no elemento H". Luego creamos un nuevo representante de VDW con escala de esfera 0.4 y los átomos seleccionados se eligen como "elemento H". Para los materiales, seleccionamos Glass3 y configuramos el color en Timestep y activamos la visualización de todos los fotogramas nuevamente en la pestaña Trayectoria. El resultado final, renderizado con Tachyon es (haga clic en la imagen para ampliarla):

2. PyMOL: Grandes ilustraciones y no solo para proteínas.

PyMOL es una herramienta de visualización molecular que se basa en una base de Python y funciona con secuencias de comandos de Python. La wiki de PyMOL es un gran recurso que profundiza en muchos detalles que pasaré por alto hoy. Para PyMOL, abra las coordenadas PPant.xyz yendo a Archivo & gtOpen y buscando el archivo.

Nota: PyMOL admite varios marcos en un solo archivo, pero solo si están en formato de modelo PDB. Puede lograr esto en PPant-Anim.xyz convirtiendo el archivo con openbabel, si lo desea.

Ahora queremos cambiar el color de los átomos de nuestra columna vertebral. En PyMOL, cada modelo, a medida que se abre, tiene un color de columna predeterminado diferente que se utiliza para distinguirlo del modelo anterior. Para cambiar ese color, seleccione la C pequeña y elija el color. Elegí densidad en el submenú de blues. Luego haga clic en C nuevamente y elija por elemento con la selección superior CHNOS con C en gris. Esto devolverá los colores de los otros elementos a los valores predeterminados típicos.

Cuando llega el momento de renderizar, podemos elegir los modos de trazado de rayos desde la línea de comandos de nuestra ventana PyMOL demarcada como PyMOL & gt y escribir:

establecer ray_trace_mode, & lt # = 0,1,2,3 & gt

donde 0 es el valor predeterminado, 1 es una representación plana similar a una caricatura, 2 es una caricatura en blanco y negro y 3 es 1 pero más extremo. Elegiremos 3 hoy.

Ahora, para renderizar nuestra imagen final, escribimos "ray" en la línea de comandos de PyMOL & gt. Una vez que finalice el renderizado (lo que puede ver en la barra de progreso), verá la imagen final.


Haga clic en Archivo & gtGuardar imagen como. & gtPNG para abrir un cuadro de diálogo y guardar su imagen final.

Espero que este tutorial te haya ayudado a usar VMD y PyMOL y a renderizar con POV-Ray y Tachyon. Envíeme un correo electrónico si tiene alguna pregunta adicional que no haya sido respondida aquí.


Trabajando con PyMOL

PyMOL y VMD son las herramientas necesarias (al menos para mí) si se trata de visualizar proteínas y sus cofactores, desde un archivo PDB (puede aprender qué es un archivo PDB aquí). Es por eso que voy a dedicar este artículo a PYMOL y uno de los siguientes a VMD.

En primer lugar, si también quieres jugar con él, ve a: https://pymol.org/2/

Nota 1: Hay una wikipedia completa sobre PyMOL y sus comandos, así que consulte esto: Configuración de PyMOL-Wiki

Nota 2: & # 8220foobar & # 8221 se utiliza a menudo como espacio para un nombre.

Realmente impresionante también es la página Galería de PyMOLwiki, con muchas recetas para cocinar por ti mismo.

Como muchos programas basados ​​en shell, también pymol tiene un archivo de configuración en tiempo de ejecución (rc corto), donde se pueden ajustar ciertos parámetros predefinidos.

Muchas de las funciones de pymol enumeradas aquí se pueden realizar fácilmente (tal vez incluso más fácilmente) mediante el uso de las características integradas de la GUI, que se pueden encontrar arriba o en los lados del programa. Pero pymol también es un programa de consola, que nos permite usar scripts especializados para ejecutar más comandos a la vez. Los scripts específicos de Pymol tienen la extensión .pml y permiten la recopilación de comandos. Al cargarlos, se ejecutarán primero.

Pero ahora vamos a entrar en él y recopilar algunos comandos.

Para cargar un nuevo código pdb simplemente use

Selección y extracción de amplificador

La selección le permite etiquetar de forma única un conjunto de átomos que son parte de un objeto (por ejemplo, una proteína que cargó).

Por ejemplo, seleccione todos los átomos de C-alfa y asígnele el nombre foobar

La extracción, por otro lado, crea un nuevo objeto a partir del conjunto de átomos seleccionado.

Por ejemplo, es posible que desee extraer el ligando (en este caso NAD) de un extracto de proteína para manipularlo en su posición más adelante.

PyMOL emplea identificadores específicos (y abreviaturas útiles) para seleccionar cosas específicas.

    • cadena: (c.): cadena específica
    • pepseq: (ps.): residuo por nombre (código de 1 letra)
    • resn: (r.): residuo por nombre (código de 3 letras)
    • resi: (i.): residuo por índice
    • nombre: (n.): átomo por nombre
    • índice: (idx.): átomo por índice interno de PyMOL

    Seleccione todos los átomos de C-alfa, C, N y O y asígnele el nombre foobar

    PyMOL además emplea un par de palabras selectoras bastante fuertes (y sus formas cortas son aún mejores).

    • todos: (*): todos los átomos
    • hidro: (h.): todos los átomos de hidrógeno
    • hetatm: (het): todos los registros HETATM
    • visible: (v.): todos los átomos habilitados y visibles
    • presente: (pr.): todos los átomos con coordenadas definidas

    Como ejemplo, este código selecciona todos los registros HETATM, que incluye todos los cofactores, aguas y ligandos.

    Seleccione átomos específicos de residuos, p. Ej. C-beta y C-gamma del residuo 4.

    Seleccione todos los heteroátomos de la molécula que no sean aguas.

    Selecciona todos los residuos dentro de 5 Angstrom alrededor del residuo 25 (que puede ser un ATOM o un HETATOM o lo que sea) y asígnele el nombre foobar

    Otra forma de hacerlo sería:

    Las operaciones lógicas también son posibles en el contexto de la selección.

    • no S1:! S1: NO
    • S1 y S2: S1 y S2: Y
    • S1 o S2: S1 | S2: O explícito
    • S1 o S2: S1 S2: implícito OR
    • S1 & amp (S2 S3): Paréntesis - Orden
    • primer S1: primer átomo
    • último S1: último átomo

    Seleccione toda la alanina en la subunidad grande (L) de la proteína.

    A medida que sus macros de selección se hacen más grandes con más subunidades, residuos y átomos, puede utilizar las macros de selección, que tienen el siguiente formato:

    Las macros de selección deben cumplir con un formato determinado:

    • debe contener al menos una barra
    • no se permiten espacios
    • vacío los campos se interpretan como comodines, así que dado que muchos archivos PDB no tienen & # 8217t un identificador de segmento, la parte & # 8220seg & # 8221 se puede dejar sola

    Representaciones

    Una forma realmente simple de ver todo acerca de su proteína de interés (especialmente con sus ligandos) es usando la GUI:

    Acción en su proteína de interés & # 8211 & gt preestablecido & # 8211 & gt sitios de ligandos & # 8211 & gt dibujos animados

    La representación más popular de la estructura tridimensional de las proteínas, la caricatura, se puede sintonizar bastante bien (PyMOL Wiki).

    Aquí puede establecer la longitud y el ancho de la hélices alfa:

    Y lo mismo ocurre con hojas beta:

    Y por supuesto para el bucles:

    Pero también hay muchos tipos diferentes de dibujos animados disponibles.

    Para & # 8220type & # 8221 puede utilizar muchas cosas diferentes:

    automático, lazo, rectángulo, óvalo, tubo, flecha, mancuerna, masilla, das

    Mi representación favorita es la pesa, que incluye la opción fancy_helices. Una vez que ejecute este comando, estará en el modo mancuerna:

    Aquí también puede establecer la longitud y el ancho de las hélices, pero a través de un comando diferente:

    Además, puede establecer el radio de la mancuerna (en los bordes de las hélices alfa)

    Forzar PyMOL para respetar estrictamente los elementos estructurales secundarios en cuanto al color:

    Haga que la caricatura sea transparente (valores entre 0 y 1):

    También puede colorear ciertas regiones de manera diferente a otras:

    También puede representar la proteína como esferas.

    Establezca el tamaño de la esfera en 0,25 A.

    La representación científicamente más precisa, especialmente si desea ver los átomos individuales que posiblemente interactúen con otro, entonces debe usar la & # 8220 representación de palos & # 8221.

    Establezca el radio del palo en un valor entre 0 (invisible) y 1 (completo).

    Cambia la transparencia de los palos de 0 (opaco) a 1 (invisible).

    Otra representación realmente agradable, especialmente para visualizar bolsas de proteínas, es la representación de la superficie. Aquí podría ser beneficioso crear dos objetos (la proteína y el ligando) usando el método de extracción:

    Antes, debe asegurarse de que su ligando sea lo que debe & # 8220 tallar alrededor & # 8221:

    Y, por supuesto, hay muchos comandos para hacer que su superficie se vea bonita, como cambiar el color.

    O el tipo de superficie desde puntos (1), hasta una malla (2) o una superficie completa (3).

    Y, por supuesto, hay muchos comandos para hacer que su superficie se vea bonita.

    Etiquetado de estructuras

    Una vez más, hay una página wiki realmente buena disponible sobre este tema.

    Una vez que haya realizado su selección y sus estructuras cristalinas tengan el aspecto que desea, puede seguir adelante y etiquetar ciertos residuos con el nombre de la molécula, el nombre del átomo, la carga o el factor b. Por ejemplo

    Aquí también puede utilizar las macros de selección para dar nombres específicos a ciertos átomos.

    Para mí, las etiquetas suelen ser demasiado pequeñas, por lo que las cambio a 20:

    Si no le gusta la posición de su etiqueta, puede cambiarla:

    Otras cosas

    Si desea ver sus dobles enlaces, use:

    Si quieres ver tus ligandos en tu proteína bien iluminados.

    Cuente todos los átomos de una selección llamada & # 8220foobar & # 8221.

    Crea un pseudoátomo en el centro de una selección.

    Establezca un color específico llamado foobar utilizando la definición RGB normalizada.

    Colorea una selección (protein_foobar) con tu color definido (color_foobar).

    Esto también se puede aplicar de forma específica para determinadas estructuras secundarias (ss).

    Pymol se puede utilizar en modo estéreo para ver su proteína en 3D.

    Para alinear dos estructuras según la similitud de secuencia, use el comando alinear:

    Por otro lado, si está planeando simplemente superponer dos estructuras independientemente de la similitud de secuencia, use el supercomando:

    Mutagénesis y alteración del archivo PDB.

    Mutagénesis, el cambio de aminoácidos en el archivo PDB se puede realizar mejor utilizando el Asistente de mutagénesis (Wizard & # 8211 & gtMutagenesis & # 8211 & gt Proteins).

    La forma de mutar uno o más aminoácidos es bastante sencilla y se describe aquí.

    Desunir un enlace químico puede ser útil a veces, ya que algunos archivos PDB no están bien resueltos y pueden haber ocurrido algunos errores. Aquí es mucho más fácil usar la herramienta de construcción integrada (que puede encontrar en la esquina superior derecha del programa). Pero también hay un comando para eso. En este caso, el nitrógeno N10 del FAD se unió accidentalmente a un hidrógeno del oxígeno O7 de un NADP. Aquí, las macros de selección (también mencionadas anteriormente) son el camino a seguir.

    Si desea repetir la misma operación una y otra vez, es posible que desee utilizar la función Iterar.

    Cambie el nombre de la cadena A por la cadena C.

    Después de haber eliminado partes de su proteína (por ejemplo, los primeros 100 AS), es posible que desee cambiar la numeración de las secuencias nuevamente, para comenzar en 1 nuevamente.

    Después de haber alterado su archivo PDB (la numeración, la cadena identifica & # 8230), use sort para obtener una vista recién ordenada de la secuencia.

    También puede cambiar las coordenadas de partes de su proteína.

    Después de haber alterado las coordenadas de su PDB, use la reconstrucción para implementar los cambios (a veces se implementa en tiempo real sin la necesidad de una reconstrucción).

    Cómo hacer bonitas imágenes en PyMOL I & # 8217ve cubierto en una publicación separada, que puede encontrar aquí.


    CASO DE ESTUDIO

    Las catalasas son enzimas hemínicas tetraméricas que descomponen el peróxido de hidrógeno en agua y oxígeno. Sirven para proteger las células de los efectos tóxicos del peróxido de hidrógeno. Como caso de estudio, utilizamos ENDscript para descifrar características en la estructura cristalina de Proteus mirabilis catalasa (entrada AP 2CAH) (21).

    Los dos residuos fundamentales del sitio catalítico de hemo-hierro son una histidina distal y una tirosina proximal. Se observa una metionina sulfona única en el sitio distal de P. mirabilis catalasa. Otra peculiaridad de esta catalasa bacteriana es su capacidad para unirse al fosfato de dinucleótido de nicotinamida y adenina (NADPH) para prevenir la inactivación por peróxido de hidrógeno (22).

    La primera figura plana muestra claramente que la estructura de la catalasa tiene una topología α + β (Figura 1A y datos complementarios 2). Además, la región N-terminal está involucrada en extensos contactos cristalográficos proteína: proteína como se muestra en las letras A en cursiva debajo del bloque de secuencia. Una letra roja identifica un contacto & lt 3.2 Å mientras que una letra negra identifica un contacto entre 3.2 y 5 Å. Leu31 se coloca a lo largo de un eje cristalográfico de 2 pliegues, como se muestra con un símbolo de almohadilla en cursiva. Leu40 y Asp44 están en contacto con el grupo hemo de un monómero simétrico como se muestra con dos puntos en cursiva. Asp44 también está involucrado en un contacto cristalográfico proteína: proteína como se muestra en un marco azul. Arg51 se une al grupo hemo del monómero como lo muestra un colon normal sobre un fondo amarillo claro. El residuo no estándar en la posición 53 (marcado con una X) es la metionina sulfona del sitio distal. Phe140 puede ser un residuo crítico: tiene estrechos contactos con el grupo hemo como se muestra en los dos puntos rojos. También participa en los contactos proteína: proteína, como se muestra en el marco azul. Finalmente, está involucrado tanto en contactos cristalográficos como no cristalográficos como lo muestra el fondo naranja. His173 se une estrechamente a NADPH como se muestra con un signo de intercalación rojo. La segunda figura plana (Figura 1B y datos suplementarios 3) revela que los elementos de la estructura secundaria están bien conservados en las catalasas depositadas en el AP.

    La representación 3D de "salchicha" (Figura 1C y archivo complementario 1) permite enfatizar la traza Cα de la región C-terminal que varía entre catalasas (el radio del tubo es proporcional a la desviación media rms entre 2CAH y catalasas homólogas). De acuerdo, la región C-terminal está mal conservada en secuencia y está coloreada principalmente en blanco (el color aumenta de blanco, baja conservación, a rojo, identidad). Por el contrario, la región N-terminal, que sobresale del núcleo de la proteína, está sorprendentemente bien conservada. De hecho, esta región está profundamente enterrada en el tetrámero biológico, que es visible al mostrar el ensamblaje biológico (Figura 1D y archivo complementario 1) incorporado automáticamente por ENDscript en el archivo de sesión de PyMOL. Finalmente, gracias a un botón preestablecido en su panel de control, PyMOL puede mostrar la superficie accesible del solvente de proteína coloreada de acuerdo con el nivel de conservación de la secuencia (Figura 1D).


    Apéndice

    Estoy muy feliz de saber que Zeynep Kürkçüoğlu Soner, un científico que trabaja en la generación de conformadores atomísticos para proteínas con varios tamaños, vio este tutorial y lo adaptó para sus propósitos en PyMOL. Aquí está su método con sus propias palabras:

    En general, es difícil visualizar los movimientos de las proteínas en imágenes estáticas, al contrario que las películas que reproducen secuencialmente las instantáneas obtenidas de simulaciones como la dinámica molecular. Para mi tesis y el artículo que se relaciona con ella, estaba tratando de encontrar un medio para presentar claramente tales movimientos y, como menciona Cem en su tutorial, los vectores no siempre son la mejor manera. Luego, encontré el trabajo de Cem relacionado con "visualizar movimientos de proteínas con imágenes estáticas" y me di cuenta de que la representación que estaba buscando estaba justo enfrente de mí. En mi trabajo, no tengo un vector de dirección específico como en el caso de los vectores normales, sin embargo pensé que con una pequeña modificación, el método también puede ser adecuado para mis figuras. Voilà, el resultado de la quinasa p38:

    La figura se obtiene del software PyMOL, con el que están familiarizados muchos biólogos estructurales y computacionales (como VMD). Personalmente, me gustan más los colores y formas obtenidos de PyMOL que los de VMD.


    Análisis de datos de simulación de dinámica molecular

    Una vez finalizada la simulación, es el momento de continuar con el análisis de los datos. El análisis consta de tres etapas. Primero, es necesario realizar algunas verificaciones estándar para evaluar la calidad de las simulaciones. Si los resultados de estos análisis muestran que las simulaciones están bien, entonces los análisis necesarios para responder a la pregunta de investigación planteada se pueden realizar por simulación. Finalmente, se pueden combinar los resultados de diferentes simulaciones.

    NOTA: Los nombres de los archivos deben ser autoexplicativos, dependiendo del sistema que simuló. Aquí asumimos que se han utilizado los nombres predeterminados, lo que significa que existen los siguientes archivos:

    • topol.tpr: el archivo de entrada de ejecución que contiene una descripción completa del sistema al inicio de la simulación
    • confout.gro: Archivo de estructura, contiene las coordenadas y velocidades del último paso
    • traj.trr: La trayectoria de precisión total que contiene las posiciones, velocidades y fuerzas a lo largo del tiempo.
    • traj.xtc: una trayectoria de peso ligero, que contiene solo coordenadas de baja precisión (0,001 nm)
    • ener.edr: parámetros relacionados con la energía a lo largo del tiempo
    • md.log: un archivo que contiene información sobre la simulación.

    Como nota al margen, muchas de las herramientas de análisis producen gráficos en forma de archivos .xvg. Estos archivos se pueden ver con el programa xmgr o xmgrace, pero también se pueden ver en una terminal usando el script de Python xvg2ascii.py.


    Comparación con datos estructurales experimentales

    Podemos usar un PCA no solo para analizar una simulación MD y extraer los principales movimientos concertados de una trayectoria, sino también para una comparación de múltiples simulaciones o para la comparación con un conjunto de estructuras experimentales, en términos de movimientos colectivos dominantes. Para la lisozima T4, se ha determinado una gran cantidad de estructuras de rayos X (si busca en el PDB "lisozima T4", encontrará más de 400 estructuras). Hemos recopilado 38 estructuras de rayos X no redundantes de lisozima T4, que se recopilan todas juntas en allpdb_bb.xtc. Al igual que en la trayectoria simulada, podemos realizar un PCA sobre la colección de estructuras experimentales:

    Pregunta: ¿Qué tipo de movimiento está representado por el primer y segundo vector propio? ¿Cómo se compara esto con los resultados de la simulación?

    Para una comparación cuantitativa de la simulación y las estructuras experimentales, proyectaremos tanto las estructuras experimentales como las estructuras simuladas en los autovectores extraídos de las estructuras de rayos X:

    Pregunta: ¿Cómo se comparan el conjunto de rayos X y MD? ¿Por qué cree que la simulación de MD no muestra las configuraciones de rayos X en el extremo izquierdo del gráfico (las conformaciones de rayos X más abiertas)? ¿Y por qué cree que el modo de torsión se muestrea con una amplitud mayor en la simulación que en el conjunto de estructuras de rayos X?

    Hay dos simulaciones adicionales disponibles para la lisozima T4, que partieron de diferentes estructuras de rayos X. Descargue las dos trayectorias de la red troncal en su disco local: md2_backbone.xtc y md3_backbone.xtc. Cross proyecte también estas dos trayectorias en los autovectores de rayos X y visualice las tres simulaciones y el conjunto de estructuras de rayos X proyectadas sobre los dos primeros autovectores del conjunto de rayos X.

    Pregunta: ¿Cuál de las tres simulaciones cubre la mayoría de las estructuras cristalográficas? ¿Considera que las simulaciones son lo suficientemente largas para muestrear las conformaciones más relevantes de la proteína?

    Pregunta: Las tres simulaciones fueron de la proteína sin sustrato. ¿Esperaría un estado más 'abierto' o más 'cerrado' como la configuración más probable en esta situación?

    Pregunta: Alternativamente, podríamos haber realizado un análisis de modos normales de esta proteína, aproximando el panorama energético por un mínimo de energía armónica multidimensional. ¿El movimiento a lo largo de los primeros vectores propios de PCA parece (cuasi) armónico? En caso afirmativo, ¿qué constante de fuerza estimaría?


    ¿Puede pymol mostrar dibujos animados (estructura secundaria) para un pdb de varios fotogramas? - biología

    UCSF ChimeraX es el programa de visualización molecular de próxima generación de UCSF RBVI. Las imágenes de esta página son CC0 y se pueden reutilizar libremente, aunque recomendamos citar UCSF ChimeraX por su nombre.

    Potencial electrostático culombínico

    El potencial electrostático culombínico (ESP) se puede calcular y mostrar con el color de la superficie usando el comando culómbico o la Pantalla de moléculas icono. No se requiere ningún cálculo o archivo ESP de entrada por separado. La imagen muestra el primer ensamblaje definido para PDB 3eeb, el dominio de proteasa de una toxina de Vibrio cholerae, con el color Coulombic predeterminado: rojo-blanco-azul sobre el rango de valores & ndash10 a 10. Para la configuración de la imagen que no sea la orientación, consulte el archivo de comando coulombic.cxc.

    Ensamblajes de mmCIF Symmetry Information

    Los ensamblajes multiméricos definidos en el archivo mmCIF de una estructura se enumeran automáticamente cuando se abre el archivo y se pueden reconstituir con el sym mando. El complejo de selenocisteína sintasa y tRNASec (PDB 3w1k) se muestra como superficies moleculares de diferentes colores para diferentes cadenas. La unidad asimétrica está a la izquierda y el conjunto especificado en el archivo mmCIF está a la derecha, con flechas y anotaciones de texto de 2 etiquetas. Vea el archivo de comando sym.cxc.

    Alternativamente, los ensamblajes biológicos se pueden buscar especificando rcsb_bio o pdbe_bio como base de datos de origen.

    Superposición Matchmaker

    los Casamentero herramienta (o casamentero comando) es conveniente para superponer estructuras relacionadas sin tener que preocuparse por la numeración o los residuos faltantes. Superpone proteínas o ácidos nucleicos mediante la creación de un alineamiento de secuencia por pares, y luego empareja los residuos alineados con la secuencia en 3D. La estructura secundaria ayuda a guiar la alineación de secuencias para un mejor rendimiento en proteínas relacionadas más lejanamente con secuencias más difíciles de alinear. De forma predeterminada, el ajuste se repite para excluir regiones estructuralmente diferentes y superponer las partes más similares más de cerca.

    Las alineaciones de secuencia resultantes se pueden mostrar, como en este ejemplo de tres pectato liasas: PDB 1jta, 1bn8 y 2pec (consulte el archivo de comando peclyases.cxc). En las alineaciones de secuencia, los residuos usados ​​en la iteración de ajuste final están encerrados en recuadros de color naranja claro. Los valores de RMSD y otras estadísticas de ajuste se informan en el Tronco.

    Coloración por conservación de secuencia

    Las estructuras atómicas, incluidas las caricaturas y las superficies moleculares, se pueden colorear mediante la conservación en una alineación de secuencia múltiple asociada. La figura muestra una estructura de & beta2-complejo de señalización del receptor adrenérgico (PDB 3sn6) con la caricatura del receptor de color azul y blanco y rarrred del menos conservado al más conservado. La & beta2El receptor adrenérgico es un miembro de la superfamilia de receptores acoplados a proteína G de clase A. La conservación se calculó a partir de una alineación de superfamilia de PASS2 utilizando la medida basada en entropía de AL2CO (incluida con ChimeraX cortesía de Pei y Grishin). La alineación de la secuencia y las instrucciones paso a paso para hacer esta imagen se dan en el tutorial Coloración por conservación de secuencia.

    Recorte por modelo

    El recorte frontal / posterior (giratorio) se puede aplicar de forma selectiva a algunos modelos, pero no a otros. Esto se usa con mayor frecuencia para cortar una superficie molecular pero no la estructura atómica correspondiente.

    Por ejemplo, la proteína en la entrada 1g74 de PDB tiene un residuo de ácido oleico OLA en un bolsillo interior. El script en pmc.cxc muestra la superficie de la proteína, activa el recorte frontal para todos los modelos y luego lo apaga solo para el modelo atómico, como se muestra en la figura. El plano de recorte se puede trasladar y rotar de forma interactiva con el ratón.

    Microscopía óptica multicanal

    Las imágenes en 3D y las series de tiempo de microscopía óptica multicanal se muestran en la Visor de volumen herramienta, con fácil acceso para ocultar / mostrar canales individuales, cambiar sus colores y ajustar los niveles de umbral con el mouse. El menú de opciones de estilo incluye & ldquovolume & rdquo (manchas translúcidas, como en la imagen), superficie, malla, proyección de máxima intensidad, plano único y ortoplanos. Por conveniencia, el tamaño del paso, los límites de la región y el estilo de visualización de diferentes canales del mismo conjunto de datos están acoplados, en el sentido de que cambiar la configuración de un canal lo cambia automáticamente para los demás.

    La imagen muestra células madre pluripotentes inducidas por humanos, con membrana plasmática en rojo violeta, fibrillarina marcada con EGFP (como marcador de nucleolo) en amarillo y ADN (núcleo) en turquesa. Los datos están disponibles públicamente en el sitio web de Allen Cell Explorer, conjunto de datos: AICS-14_0.

    Realidad virtual

    La realidad virtual ChimeraX funciona con los sistemas HTC Vive, Oculus Rift y Samsung Odyssey (los compatibles con SteamVR). Cualquier estructura, mapa, etc. que se puede mostrar en ChimeraX se puede ver en el auricular y se puede manipular con los controladores de mano. Las barras de herramientas de iconos visibles en los auriculares permiten cambiar la visualización de la escena o las asignaciones de los botones del controlador manual con un solo clic. Además de la rotación, la traslación y el zoom, las funciones útiles incluyen el etiquetado, la medición de distancias, la rotación de enlaces, la colocación de marcadores en un mapa y el cambio de los niveles de contorno del mapa. El modo de realidad virtual (VR) se puede activar y desactivar con el vr comando, y el cita El comando permite que varios usuarios compartan una sola sesión en realidad virtual.

    Cilindros helicoidales curvos

    Las proteínas y las hélices alfa se pueden mostrar como cilindros curvos y ldquotubos y ldquo con el estilo de dibujos animados mando. El modo de tubo helicoidal es una alternativa a las cintas en espiral estándar, y ambos modos están completamente integrados con dibujos animados de bobina y & beta-strand. La estructura de la izquierda es un receptor de glutamato del subtipo AMPA unido al fármaco antiepiléptico perampanel (PDB 5l1f). The receptor is tetrameric, and each chain is rainbow color-coded from blue at the N-terminus to red at the C-terminus. Four molecules of perampanel (pink) are bound near the bottom, between the transmembrane domain and the rest of the receptor. For image setup other than orientation, see the command file ampar.cxc.

    Interactive Chain Network

    Chain-chain interfaces can be identified by buried surface areas and displayed as a network diagram with the interfaces command or the Molecule Display icon . In the diagram, nodes (circles) represent chains, larger for greater surface areas, and edges (lines) between nodes represent chain-chain interfaces (default &ge 300 Å 2 buried area). Dotted lines represent interfaces smaller than half the size of the largest in the structure. Diagram context menus enable a variety of actions, such as &ldquoexploding&rdquo the structure by moving chains apart, hiding all but the chains in contact with a given chain, and showing a more detailed plot of the residues forming a given interface.

    The structure is an HIV envelope glycoprotein trimer bound by three copies of a broadly neutralizing antibody (PDB 5v8m), with chain information shown in the Log. Glycosylations (not displayed) were included in the surface area calculations. For setup, see the command file trimer-network.cxc.

    Struts for 3D Printing

    Structures can be reinforced for 3D printing with pseudobonds. In this DNA-transcription factor complex (PDB 5ego), proteins are shown as ribbons and the DNA as a molecular surface. The pseudobonds in blue were read in from a manually created file, 5ego.pb, and further reinforcements in light gray were added automatically with the puntales mando. For image setup other than orientation, see the command file struts.cxc.

    Rotamers and Swapaa Virtual Mutation

    Rotamers is an interface for showing amino acid sidechain rotamers and optionally replacing the original sidechain, also implemented as the swapaa mando. The rotamers can be shown all at once, as in the figure, or individually by choosing rows in the dialog.

    The figure shows binding-site residues of the thyroid hormone receptor &beta with hormone bound, PDB 3gws. Rotamers for the hormone-resistance mutations N331H and L346R are shown as partially transparent sticks, with H-bonds (light blue dashed line) and clashes (light purple dashed lines) calculated for the histidine rotamers at position 331. The rotamer-list dialog for this position is also shown. Command script rotamers.cxc contains the initial, noninteractive part of the setup.

    These mutations are described in Cardoso et al., Endocrino (2020). Although one histidine rotamer may be able to form the same pocket-stabilizing H-bond as the wild-type asparagine, it also clashes with several atoms (third row in the dialog). H-bonds and clashes are not shown for the arginine rotamers at 346, but they all clash significantly with the hormone and/or other pocket atoms.

    Color Palettes

    A &ldquopalette&rdquo or ordered series of colors is used to color items sequentially (arcoíris) or by values such as density. The ten chains in PDB 5o3l (paired tau filament) have been colored with the commands shown as 2D labels in the images. The first two examples at left use predefined palettes (credit to www.ColorBrewer.org, color specifications and designs by Cynthia A. Brewer, Pennsylvania State University), whereas the third shows specifying colors individually.

    Multichain Comparative Modeling

    Modeller Comparative is an interface to Modeller for comparative (&ldquohomology&rdquo) modeling of proteins and protein complexes.

    The example shows modeling the human (shades of blue) from the mouse (brown and tan) complex of programmed death-1 (PD-1) with its ligand PD-L2, PDB 3bp5.

    Comparative modeling requires a template structure and a target-template sequence alignment for each unique chain. The sequences of human PD-1 and PD-L2 targets were fetched from UniProt and associated with the corresponding chains in the template structure, see model-pdl-setup.cxc. (Pairwise or multiple sequence alignments could have been used, but in this case, the template structure was simply associated with the target sequence.) Sequence-structure association shows mismatches in the Sequence Viewer: pink boxes for sequence differences between mouse and human, and gray outlines around the parts missing from the structure.

    Three models were made with with default settings (other than the number of models), and the best-scoring model is shown. Two positions where sequence differences change the interfacial H-bonds are displayed.

    Morphing Movie

    • inactive structure (PDB 3c4f, chain A)
    • activated structure (PDB 3gqi, chain A) with phosphorylated tyrosines and bound ATP analog

    Morphing and other setup was done with the command file kmorph-prep.cxc, followed by interactively positioning the structure and saving the view with the command view name p1 (generally a session would also be saved at this point), then running kmorph-play.cxc to add 2D labels and record the movie.

    Coloring by Molecular Lipophilicity Potential

    Molecular lipophilicity potential (MLP) can be calculated for a protein and displayed with surface coloring using the command mlp or the Molecule Display icon . The image shows the photosynthetic reaction center from a purple sulfur bacterium, with MLP coloring on the molecular surface and membrane boundaries from OPM (Orientations of Proteins in Membranes entry 1eys). Blue and red balls represent the cytoplasmic and periplasmic sides of the bacterial inner membrane, respectively. Parts of the L, M, and H chains span the membrane, whereas the cytochrome subunit sits on the periplasmic side, at the top. The surface coloring ranges from dark goldenrod for the most hydrophobic potentials, through white, to dark cyan for the most hydrophilic. Ligands including lipid, detergent, heme, and various other cofactors are shown as purple surfaces.

    For image setup after the structure from OPM has been opened, see the command file mlp.cxc.

    Interactive H-Bond Histogram

    Hydrogen bonds (H-bonds) can be identified with the command hbonds or the Molecule Display icon and plotted as an interactive histogram with the command crosslinks histogram.

    The ChimeraX graphics window shows the complex between a natural killer cell receptor 2B4 and its ligand CD48 (PDB 2ptt). The receptor protein is blue, the ligand protein pink, and H-bonds between them dashed yellow, with H-bonding residues labeled. Although not done here, the H-bonds could also be labeled by distance.

    The histogram of H-bond distances on the top right is interactive: when the cursor is placed over a bar in the histogram, the corresponding H-bonds are temporarily enlarged in the 3D view and the others hidden. For image setup other than orientation, see the command file hb3.cxc.

    Fitting to Density Maps

    Atomic structures and/or maps can be fit rigidly into other maps with the Mapa icon , the Fit in Map tool, or the fitmap mando. A common use is to locally optimize the fit after initial placement by hand. The command includes options for symmetrical and sequential fitting, as well as global search to generate multiple starting points for local optimization.

    Elongator is a highly conserved complex that associates with RNA polymerase II during transcriptional elongation. In the image, one of its six subunits, Elp2 (PDB 5m2n), has been fit into a map of the Elp123 subcomplex (EMDB 4151).

    Ambient Occlusion Molecular Surfaces

    Several lighting modes are available, including ambient occlusion. The image shows hemoglobin (PDB 4hhb) with the four chains shown as surfaces of different colors and heme residues as spheres. El comando lighting soft or the Gráficos icon can be used to turn on ambient shadowing from 64 directions. El comando lighting gentle gives a similar result, except tuned to emphasize larger indentations.

    Cartoon/Nucleotide Presets

    los Presets menu includes a few different combinations of cartoon and nucleotide styles, shown here along with overall settings from the Publication preset plus lighting depthcue false. The style settings of cartoons and nucleotides can be controlled individually (and with many more possibilities than shown here) with cartoon style y nucleótidos, respectivamente. Ver también: Toolbar nucleotides icons

    ribbons/slabs cylinders/stubs licorice/ovals
    More features.

    Stylized Nucleotides

    Different representations of nucleotides can be shown with the nucleótidos command or Toolbar icons. Options include filled rings, slabs for bases (box, muffler, or ellipsoid shape), bumps on slabs to show base orientation, simple tubes instead of ribose atoms, and continuous or broken ladder rungs. Nucleotide representations can be the same color as the ribbon or a different color, and multiple nucleotide styles can be used within a single structure.

    CryoEM Ambient Occlusion

    A cryoelectron microscopy map of the 26S proteasome (EMD-4321) is shown at the author-recommended contour level in two different lighting modes: &ldquosimple&rdquo on the left and &ldquosoft&rdquo on the right. Soft lighting includes ambient lighting and shadowing (occlusion) and can be turned on with the command lighting soft or by clicking the Gráficos icon .

    For setup of the righthand image, see the command file ambient.cxc.

    Copyright 2018 Regents of the University of California. Reservados todos los derechos.


    I would like to thank Christopher A. Hunter, Christopher R. Calladine, Helen M. Berman, Catherine L. Lawson, Zukang Feng, Wilma K. Olson and Harmen J. Bussemaker for their helpful input on the block schematic during its continuous evolution for over two decades. I appreciate Thomas Holder (PyMOL Principal Developer, Schrödinger, Inc.) for writing the DSSR plugin for PyMOL, and for providing insightful comments on the manuscript and the web application interface. I also thank Jessalyn Lu and Yin Yin Lu for proofreading the manuscript, and the user community for feedback.

    National Institutes of Health (NIH) [R01GM096889]. Funding for open access charge: National Institutes of Health (NIH) [R01GM096889].


    Ver el vídeo: PyMOL Tutorial: Modeling the SARS-CoV-2 RBD Interactions with ACE COVID-19 Coronavirus Proteins (Enero 2022).