Efeitos da protonação de histidina e estados rotamericanos na triagem virtual do M. tuberculosis RmlC

Para avaliar o efeito da protonação de histidina e estados rotamericanos no desempenho preditivo dos receptores, realizamos a triagem virtual (VS) para a enzima Mtb RmlC com base nos resultados de um estudo prévio de triagem de alto rendimento (HTS). Abaixo, examinaremos primeiro as interações típicas do ligante co-cristal TRH para sondar o ligante, que depende da protonação de histidina. Contextualizamos ainda a análise do desempenho do enriquecimento e do poder preditivo de vários modelos de receptores, discutindo as interações com o receptor para mostrar o efeito de diferentes estados de protonação de histidina sobre a SV. Finalmente, comparamos os valores previstos de pKa calculados por vários pacotes de cálculo de pKa comuns com os estados de protonação do receptor com o melhor poder preditivo.

Dock de TRH

Dock do ligante co-cristal TRH de volta em 36 modelos de receptores foi realizado para mostrar a pose, ou orientação do ligante em relação ao receptor, dependência da protonação de histidina e estados rotamericanos. Os padrões de ligação de hidrogênio quimicamente intuitivos para as coordenadas cristalinas de His62 e His119, mostrados na Fig. 2b, implicam o significado potencial das ligações de hidrogênio no acoplamento do TRH. O acoplamento deste ligando permitiu o exame preliminar da dependência de pose nas possíveis redes de ligação de hidrogênio com o receptor.

Variar os estados de protonação de histidina tem um efeito claro na previsão de pose para o determinado ligando de co-cristais. O RMSD de pose de ancoragem de TRH autodocado nas coordenadas cristalinas para diferentes estados de protonação e rotamericanos de His62 e His119 variou de 2,91 a 5,44 Å. O estado de protonação de ambas as histidinas com a melhor média de RMSD é HIE, que concorda com os estados de protonação mais prováveis das coordenadas cristalinas de TRH. Além disso, em todos os casos o algoritmo de acoplamento prevê corretamente a posição do pirofosfato do ligante, mas o grande desvio das coordenadas dos cristais decorre principalmente da rotação da timidina e da ramnose em torno do pirofosfato, resultando em diferentes padrões de ligação de hidrogênio entre o TRH e duas histidinas. Isto indica a importância das redes de ligação de hidrogênio com His62 e His119 na previsão da pose do ligante co-cristal TRH. Portanto, após examinar a dependência de pose das ligações de hidrogênio fornecidas por duas histidinas, expandimos nosso estudo para examinar sistematicamente a classificação dos compostos em VS e como ela é afetada pela protonação e rotomericidade dos estados de histidinas.

Reavaliação virtual

Acostagem molecular foi realizada para examinar a dependência da classificação dos compostos na protonação da histidina e estados rotomericais. O conjunto ligando incluiu dez ativos e 2.000 inativos selecionados aleatoriamente de um HTS. Observamos que as pontuações de Tanimoto indicam que a maioria dos nossos decoys tem uma baixa semelhança com os ativos. Tal conjunto de chamarizes apresenta um desafio menor ao algoritmo de acoplamento e o desempenho preditivo do próprio VS pode ser afetado quando chamarizes com maior semelhança com os ativos são usados. Entretanto, este estudo visou examinar não o desempenho preditivo do algoritmo de acoplamento per se, mas como os estados de protonação de histidina afetam o desempenho relativo em VS.

Ligandos ativos bloqueados e o produto análogo foram examinados inicialmente para caracterizar interações importantes no local de ligação do RmlC. Em todos os modelos de receptores, as interações de empilhamento pi-pi hidrofóbico contribuem significativamente para a pontuação de acoplamento dos compostos ativos dentro do site ativo RmlC. O composto de ataque inicial do HTS, SID7975595, está classificado em alta na maioria dos modelos de receptores, entre a 8ª e 51ª posição em 26 dos 36 receptores. Embora exista apenas uma semelhança estrutural limitada entre o SID7975595 e o ligante co-cristal TRH, o anel tricíclico do SID7975595 substitui prontamente a fracção tiamidina TRH, enquanto o anel benzimidazolona substitui a fracção ramnose, fornecendo a base estrutural da inibição. Como mostrado na Fig. 3, a interação hidrofóbica entre os ativos e o receptor freqüentemente envolve Tyr132 e Tyr138 da cadeia A e Phe26 da cadeia B (note que uma parte da cadeia B se intromete no local ativo da cadeia A). Através da interação com os resíduos essenciais do local de ligação e evitando que as moléculas de água acessem Phe26 e Tyr132, os ativos fornecem contatos hidrofóbicos abundantes para alcançar a alta afinidade de ligação. Conforme discutido em Sivendran et al. , a substituição do grupo etílico ligado ao nitrogênio no anel tricíclico de SID7975595 por um grupo aliado (por exemplo, o composto ativo 77074) aumenta ainda mais a afinidade de ligação ao formar um selo hidrofóbico ainda mais apertado. Em comparação, a substituição deste grupo por um grupo metilo menor ou por um átomo de hidrogênio resulta em uma menor afinidade de ligação . Além dos contatos hidrofóbicos descritos acima, alguns dos ativos também formam ligações de hidrogênio com Ser51, Arg59, e Arg170. Uma figura descrevendo as interações dos ativos acoplados pode ser encontrada no Recurso Online 3.

Fig. 3

Interacção prevista do composto de ataque inicial SID7975595 com HID62 invertido e HIP119 no modelo receptor 23. Geralmente, os ativos não têm fortes interações com His62 ou His119, mas estados variáveis de protonação de histidina têm um efeito profundo sobre os resultados classificados. Interações favoráveis são observadas com outros resíduos de sítios de ligação, tais como Tyr132 e Tyr138 como aqui descrito

Interessantemente, os ativos geralmente não alcançam interações polares com His62 e His119. Como mostrado na Fig. 3, o oxigênio carbonilo e dois nitrogênios de benzimidazolona de SID7975595 estão de face para face com His62 e His119. A direção dos hidrogênios aromáticos dos ativos é freqüentemente incapaz de participar das redes de ligação de hidrogênio com as duas histidinas. Entretanto, diferentes protonações e estados rotamericanos dessas histidinas afetam os resultados da SV através de suas interações com os decoys.

Avaliação das diferenças de classificação

Não é raro que apenas o 1% superior dos compostos rastreados possa ser testado experimentalmente em um estudo da SV, devido aos recursos limitados. Portanto, o fator de enriquecimento (EF)1% métrico, que reflete o desempenho do enriquecimento da base de dados no 1% superior (20 compostos acoplados) de uma biblioteca, torna-se particularmente relevante na avaliação do poder preditivo do VS. O EF1% varia de 0 a 80 para modelos de 36 receptores (Tabela 1), indicando que os resultados do VS são sensíveis à protonação e aos estados rotamericanos de His62 e His119 de RmlC. No entanto, 28 dos 36 receptores classificam mais de oito ativos dentro dos 10 % superiores da SV, como refletido pelo EF10% (Tabela 1), sugerindo que a maioria dos receptores é capaz de distinguir os ativos e decoys quando uma porção maior (10%) da base de dados é considerada. Os resultados do EF também sugerem que os modelos receptores com HIP62 ou HIP119 tendem a ter um mau desempenho de enriquecimento, provavelmente devido às extensas redes de ligação de hidrogênio com os decoys, como discutido posteriormente.

A área sob a curva característica operacional do receptor (AUC) para cada modelo receptor foi avaliada para relatar o desempenho de enriquecimento dos modelos sobre diferentes protonação e estados rotamericanos de His62 e His119. Como mostrado na Fig. 4a e na Tabela 1, os valores da AUC de todos os modelos de receptores variam de 0,868 a 0,996, indicando um bom desempenho preditivo geral (uma AUC de 0,5 corresponde a nenhuma diferenciação entre os ativos e decoys). Em geral, o resultado da AUC é complementar à avaliação da EF para o desempenho preditivo dos receptores. A Tabela Sumária 1, Fig. 4c mostra como o intervalo do desempenho do receptor depende dos dois estados de protonação de histidina e rotamericana. Considerando a faixa de 25-75 % dos AUCs (Fig. 4c, indicada pelas linhas mais grossas), os modelos His62 mostram uma variação maior entre os estados His119. Os modelos His119, por outro lado, têm um desempenho mais consistente independentemente dos estados de protonação de His62, com exceção do estado HIP. Isso indica que diferentes estados de protonação de His62 têm uma influência menor que os de His119 no desempenho do receptor em nossa triagem.

Fig. 4

um valor AUC de 36 modelos receptores. Protonação e estados rotamericanos são marcados para cada histidina. Os estados invertidos são marcados com a letra F. A cor mais escura indica AUC mais alta e melhor desempenho preditivo do modelo receptor correspondente. b Percentagem média de ligação de hidrogênio dos principais compostos de 1 % em 36 VS. A protonação e os estados rotamericanos são marcados para cada histidina. A cor mais clara indica maior porcentagem de ligação de hidrogênio, com % de unidade para a barra de cores. O R2 para a correlação entre os AUCs e a porcentagem média de ligação de hidrogênio para cada execução de VS é de 0,42 (ver Recurso Online 4 para o gráfico de dispersão). c Dependência do desempenho do receptor em relação ao His62 (superior) e His119 (inferior). A mediana dos valores do AUC de cada estado de protonação é mostrada com uma grande linha horizontal. Os pequenos ticks em cada modelo de histidina marcam seis estados diferentes de protonação da outra histidina. As linhas verticais mais grossas representam 25-75 % da gama de AUCs. Os melhores modelos receptores são mostrados explicitamente com os estados de protonação dos modelos

Uma maior dependência de enriquecimento dos estados de protonação de His119 é observada nos modelos HIE62 e HIP62. Com o estado HIE62, os modelos com HIP119 invertido (modelo 6) e HIE119 invertido (modelo 2) produzem o mais alto desempenho do receptor. Os modelos 3 e 5 com HID119 e HIP119, respectivamente, conduzem ao pior enriquecimento. Ao examinar porque é que o estado HIE62 tem a maior variação nos AUCs, verifica-se que o His62 ou tem empilhamento pi-pi ou não tem interacções com ligandos, e faz apenas algumas ligações de hidrogénio com decoys de alto nível. Portanto, o desempenho do receptor depende da interação do His119 com os decoys. Isto também é visto ao examinar a ampla gama de desempenho dos AUCs dos modelos HIP62. As redes de ligação de hidrogênio com os decoys serão discutidas mais adiante na seção seguinte.

A fim de avaliar a significância estatística da diferença dos valores da CUA entre um par de modelos receptores, realizamos um teste p em duas faces no nível de 95% na hipótese nula de que o par tem valores da CUA estatisticamente comparáveis, contra a hipótese alternativa de que sua diferença nos valores da CUA e no poder preditivo é estatisticamente significativa. O resultado é mostrado na Tabela de Recursos Online 1, com os valores de p menos de 0,05 enfatizados. Em média, os receptores têm mais de 16 valores de p inferiores a 0,05, demonstrando a sensibilidade da SV na histidina protonação e estados rotamericanos. Como seria de se esperar, os receptores com diferenças mais significativas correspondem aos modelos com maior (modelo 6) ou menor valor de AUC (modelos 3, 29 e 5). O modelo 6 é estatisticamente melhor na classificação dos ativos sobre os decoys do que 26 outros receptores do conjunto. Os modelos 3, 29 e 5 se distinguem por serem piores na classificação dos ativos do que 29, 25 e 31 outros receptores, respectivamente.

Análise quantitativa das interações de ligação de hidrogênio foi realizada para o 1% superior (20 compostos acoplados) de cada resultado de VS para contabilizar as abundantes interações de ligação de hidrogênio com os resíduos do local de ligação frequentemente observados com os decoys. Os resultados indicam uma correlação inversa entre a contribuição da ligação de hidrogênio e o desempenho do receptor. A Figura 4b mostra a porcentagem média de ligação de hidrogênio de cada modelo receptor para os principais compostos atracados a 1 %. A porcentagem de ligação de hidrogênio é definida como a parte do termo de ligação de hidrogênio do Glide XP no escore total de acoplagem. A comparação da Figura 4a, b revela a relação inversa entre a porcentagem de ligação de hidrogênio e a AUC com um R2 de 0,42 (y = -56,18x + 67,95, a correlação é plotada no Recurso Online 4). A relação inversa é normalmente observada com modelos com HIP119, HIP119 invertido, ou HID62, onde a alta porcentagem de ligação de hidrogênio resultou em um mau enriquecimento. Por exemplo, o modelo receptor 29 com HIP62 e HIP119, onde ambas as histidinas apresentam local ativo enfrentando doadores de ligação de hidrogênio, tem um dos piores AUCs devido à alta porcentagem de ligações de hidrogênio nos acessos superiores.

Notavelmente, o potencial de ligação de hidrogênio do His119 frequentemente determina o desempenho do receptor. Por exemplo, o modelo com HID62 e HIP119 foi um outlier entre os modelos HID62 da Fig. 4c, com um enriquecimento notavelmente baixo em comparação com o bom desempenho geral dos outros cinco modelos HID62. Os modelos HID62 têm um AUC médio alto de 0,989, apesar da freqüente ligação de hidrogênio aos decoys do HID62. Isto é devido aos estados His119 conseguindo poucas interações de ligação de hidrogênio com os decoys. Apenas com o estado HIP119 o modelo HID62 faz ligações de hidrogênio com vários decoys, resultando na AUC relativamente baixa. Esta observação concorda com a maior dependência do desempenho do receptor em relação aos estados de protonação de His119, conforme discutido acima. O Recurso Online 4 descreve a distribuição da AUC e a porcentagem de ligação de hidrogênio juntamente com a direção do doador ou aceitador da ligação de hidrogênio a partir de duas histidinas voltadas para o receptor.

As análises acima destacam o efeito inibidor da ligação de hidrogênio às iscas sobre o poder preditivo da VS, devido às várias coordenadas de duas histidinas com protonação e estados rotamericanos diferentes. A dispersão da correlação observada com o R2 de 0,42 é provavelmente atribuída a várias causas, incluindo a natureza química do conjunto de dados do engodo, bem como as pequenas diferenças na geometria de cada receptor após a minimização no preparo inicial da proteína. Ao mostrar claramente a sensibilidade dos resultados da triagem virtual em diferentes prótons e estados rotamericanos de histidinas no local ativo, enfatizamos que deve-se ter cuidado ao preparar as coordenadas atômicas de um receptor para a SV, particularmente considerando as propriedades gerais dos ligandos que estão sendo triados. Isto inclui levar em conta a ligação de hidrogênio ao ligante co-cristal e seu efeito na preparação da proteína, bem como uma análise abrangente das redes proximais de ligação de hidrogênio. Isto é geralmente conseguido examinando os resultados de pacotes de software de previsão pKa amplamente utilizados e, até este ponto, temos comparado os resultados de diferentes pacotes em relação aos nossos resultados VS e discuti-los mais a fundo.

Dock dos decoys

Vários fatores levam a diferenças de classificação entre os receptores, particularmente no que diz respeito aos decoys. Geralmente, os chamarizes que se classificaram acima dos ativos eram de alto peso molecular e tinham mais potencial para ter ligações de hidrogênio com o receptor. Nesta seção, analisamos ainda os freqüentes padrões de interação observados entre os decoys e o receptor, com foco nos modelos receptores com baixo enriquecimento.

Decoys tendem a ter maior peso molecular e mais estruturas em anel do que os ativos (Tabela 2). Isto resulta em decoys com maior classificação, devido às interações hidrofóbicas na ausência de ligações de hidrogênio com o receptor. A Figura 5a mostra as interações hidrofóbicas obtidas através do grande composto inativo 16952387 no modelo receptor 19. Este composto é frequentemente classificado entre os cinco primeiros em muitas séries de VS por suas interações substanciais de empilhamento pi-pi com Phe26, Tyr132, e Tyr138. Esta tendência é frequentemente observada na triagem virtual onde moléculas maiores se classificam melhor como resultado de extensas interações com o receptor .

Tabela 2 Comparação do peso molecular, número de doadores de ligações de hidrogênio e número de aceitadores de ligações de hidrogênio para os ativos e decoys
Fig. 5

uma Interação do composto inativo 16952387 com HID62 e HIE119 invertido no modelo receptor 19. O composto não tem nenhuma interação com a histidina. As interações de empilhamento Pi-pi com Phe26 da cadeia B, Tyr132 e Tyr138 contribuem para sua alta classificação, juntamente com as ligações de hidrogênio com Arg23, Arg59, Arg170 e Ser51 (não mostrado). b Interação do composto inativo 17388064 com HIE62 e HID119 no modelo receptor 3. Ambas as histidinas fornecem ligações de hidrogênio ao composto

>888888>

O desempenho do enriquecimento é particularmente baixo para os receptores que fornecem abundantes redes de ligação de hidrogênio aos decoys. As interações através de His62 e His119 não foram amplamente observadas para os ativos e, portanto, compostos com maiores contribuições enthalpic erroneamente classificados de forma mais favorável. Um exemplo mostrado na Fig. 5b mostra a interação do composto inativo 17388064 no modelo receptor 3 (AUC 0,868), classificado como o primeiro. Neste receptor, que é o pior na classificação dos compostos baseados na AUC, o composto 17388064 forma duas ligações de hidrogênio com duas histidinas, uma entre seu hidrogênio hidroxila e o hidrogênio δ-nitrogênio do HIE62 e a outra entre seu oxigênio hidroxila e o hidrogênio no δ-nitrogênio do HID119. Este composto tem cinco doadores de ligações de hidrogênio e nove aceitantes, um grande número em comparação com as respectivas médias dos decoys e ativos (Tabela 2). Portanto, com uma alta contribuição da ligação de hidrogênio para a pontuação total de 34,7 ± 6,62 %, este composto de isca é freqüentemente observado para formar pelo menos uma ligação de hidrogênio com qualquer uma das duas histidinas, obtendo assim altas classificações em múltiplas execuções VS.

Dois outros modelos receptores, modelo 29 com HIP62 e HIP119 e modelo 5 com HIE62 e HIP119, mostram padrões de interação similares aos iscas como o modelo 3. Estes três modelos têm os valores mais baixos de AUC, com uma média de 0,870 entre eles. Como discutido acima, seus valores de AUC diferem significativamente de outros receptores, refletindo a relação sutil entre as ligações de hidrogênio obtidas através de His62 e His119 e o fraco enriquecimento. Um número adicional descrevendo as redes de ligação de hidrogênio entre os decoys e receptores é fornecido no Recurso Online 5.

pKa predição para His62 e His119

Nossos resultados demonstram claramente a sensibilidade da triagem virtual na protonação de histidina e estados rotamericanos. Em muitos estudos biofísicos computacionais, os estados de protonação dos resíduos tituláveis são determinados usando vários programas de predição pKa. Para avaliar o desempenho desses programas para identificar o modelo receptor com o melhor poder preditivo no docking, comparamos os resultados da previsão pKa de His62 e His119 do PROPKA, Maestro, H++ e MCCE, como mostrado na Tabela 3 com os valores calculados de pKa.

Tabela 3 Comparação das previsões para os estados de protonação de His62 e His119 de RmlC feitas por software comumente utilizado, com valores de pKa calculados

Primeiro, PROPKA 3.1 prevê que tanto His62 quanto His119 são neutros, independentemente da presença de TRH durante a preparação. O programa, entretanto, não pode atribuir estados rotamericanos de histidinas. Portanto, um estado de HID, HID invertido, HIE, ou HIE invertido deve ser determinado manualmente. Semelhante ao PROPKA, o programa H++, que utiliza uma estrutura de eletrostática contínua, também encontra ambas as histidinas como neutras, embora os valores de pKa previstos sejam diferentes daqueles do PROPKA. O programa MCCE, que é baseado na eletrostática de multiconformação contínua, prevê que o His62 seja neutro enquanto o His119 seja protonado.

Next, usamos o Assistente de Preparação de Proteínas no Maestro para calcular a pKa do His62 e His119 com e sem TRH. Note que Maestro é capaz de variar os estados rotamericanos, enquanto PROPKA não pode. Uma atualização recente permite ao Maestro empregar o PROPKA em sua previsão pKa ao invés do Epik. Com o Epik, o Maestro prevê tanto o His62 como o His119 em estados duplamente protonados, independentemente da presença do TRH. Curiosamente, o modelo receptor que corresponde a este estado multi-histidina tem o pior poder de previsão com uma AUC de 0,869. Quando PROPKA é usado, HIP62 e HIE119 são previstos para o complexo proteína-TRH e HIE62 e HIE119 para a proteína apo. Estas duas previsões do PROPKA no Maestro correspondem aos modelos de desempenho de enriquecimento moderado, com AUCs de 0,971 para o modelo 25 (HIP62 e HIE119) e 0,942 para o modelo 1 (HIE62 e HIE119), respectivamente.

Dado que as previsões acima feitas por diferentes softwares variam significativamente um do outro, deve-se ter cuidado ao usar estes resultados como uma diretriz para preparar uma proteína para triagem virtual. Sem um conhecimento íntimo do verdadeiro estado de protonação do receptor, bem como dos ligandos a serem rastreados, é difícil resolver este problema. Portanto, sugerimos que uma análise em pequena escala, como a realizada neste estudo, e uma comparação com dados experimentais, se disponíveis, poderia fornecer uma descrição mais precisa da protonação e estados rotamericanos dos resíduos tituláveis em receptores de proteína para futuras triagens em maior escala. Alternativamente, um modelo que inclua a incorporação explícita de protonação de cadeia lateral alternativa e estados rotamericanos durante o acoplamento, potencialmente com informações armazenadas na grade como existe para hidroxilas e tióis rotatáveis no Glide, pode valer a pena ser perseguido. O exame dos resultados com respeito aos estados de protonação e classificações baseadas em interações com histidinas deve ser cuidadosamente examinado antes de proceder aos testes experimentais.

Adicionalmente, a flexibilidade dos receptores provavelmente afetará os estados de protonação dos resíduos ionizáveis. Embora isto não tenha sido estudado explicitamente aqui, além da minimização de cada receptor após a atribuição de estados de protonação, a flexibilidade proteica é claramente importante para o desenho e desenvolvimento de drogas. Considerando o espaço conformacional e de protonação em conjunto torna-se rapidamente intratável com métodos físicos como os aqui descritos, mas métodos de amostragem melhorados demonstram ser promissores no combate a tais dificuldades. Isto inclui simulações de dinâmica molecular de pH constante, para a qual o pH é uma variável termodinâmica externa, utilizada para a previsão cega dos valores de pKa dos resíduos tituláveis . A aplicação eficaz dos resultados dessas simulações ao desenho molecular é uma área de interesse contínuo. Os conjuntos de equilíbrio de tais simulações podem ser usados em conjunto com a ancoragem como uma aplicação de esquema complexo relaxado, onde a triagem virtual é conduzida com um conjunto de diferentes estruturas protonadas, para melhorar os resultados do enriquecimento . Levar em conta a flexibilidade do receptor na preparação do alvo levará a uma amostragem mais ampla do espaço de conformação e protonação, melhorando assim o desempenho do VS.

Deixe uma resposta

O seu endereço de email não será publicado.