Effetti della protonazione dell’istidina e degli stati rotamerici sullo screening virtuale di M. tuberculosis RmlC

Al fine di valutare l’effetto della protonazione dell’istidina e degli stati rotamerici sulle prestazioni predittive dei recettori, abbiamo eseguito lo screening virtuale (VS) per l’enzima Mtb RmlC basato sui risultati di un precedente studio di high-throughput screening (HTS). Di seguito, esamineremo prima le interazioni tipiche del co-cristallo ligando TRH per sondare la dipendenza della posa del ligando dalla protonazione dell’istidina. Abbiamo ulteriormente contestualizzare l’analisi delle prestazioni di arricchimento e il potere predittivo di vari modelli di recettore, discutendo le interazioni con il recettore per mostrare l’effetto di diversi stati di protonazione istidina su VS. Infine, confrontiamo i valori pKa previsti calcolati da diversi pacchetti di calcolo pKa comuni agli stati di protonazione del recettore con il miglior potere predittivo.

Docking di TRH

Docking del ligando co-cristallo TRH in 36 modelli di recettore è stato effettuato per mostrare la posa, o orientamento del ligando rispetto al recettore, dipendenza dalla protonazione dell’istidina e dagli stati rotamerici. I modelli di legame a idrogeno chimicamente intuitivi per le coordinate cristalline di His62 e His119, mostrati in Fig. 2b, implicano la potenziale importanza dei legami a idrogeno nel docking di TRH. Il docking di questo ligando ha permesso di esaminare preliminarmente la dipendenza della posa dalle possibili reti di legame a idrogeno con il recettore.

La variazione degli stati di protonazione dell’istidina ha un chiaro effetto sulla predizione della posa per il ligando co-cristallo determinato. La RMSD della posizione di docking del TRH auto-dockato nelle coordinate del cristallo per diversi stati di protonazione e rotamerici di His62 e His119 varia da 2,91 a 5,44 Å. Lo stato di protonazione di entrambe le istidine con la migliore RMSD media è HIE, che concorda con gli stati di protonazione più probabili delle coordinate del cristallo del TRH. Inoltre, in tutti i casi l’algoritmo di docking predice correttamente la posizione del pirofosfato del ligando, ma la grande deviazione dalle coordinate del cristallo deriva principalmente dal capovolgimento delle società di timidina e ramnosio intorno al pirofosfato, con conseguenti diversi modelli di legame a idrogeno tra TRH e due istidine. Questo indica l’importanza delle reti di legame a idrogeno con His62 e His119 nella predizione della posa del co-cristallo ligando TRH. Pertanto, dopo aver esaminato la dipendenza della posizione dai legami a idrogeno forniti da due istidine, abbiamo ampliato il nostro studio per esaminare sistematicamente i composti di classificazione in VS e come è influenzato dalla protonazione e dagli stati rotamerici delle istidine.

Selezione virtuale

Il docking molecolare è stato effettuato per esaminare la dipendenza della classificazione dei composti dalla protonazione dell’istidina e dagli stati rotomerici. Il set di ligandi includeva dieci attivi e 2.000 inattivi selezionati a caso da un HTS. Notiamo che i punteggi di Tanimoto indicano che la maggior parte delle nostre esche hanno una bassa somiglianza con gli attivi. Un tale set di esche presenta una sfida minore per l’algoritmo di docking e le prestazioni predittive di VS stesso possono essere influenzate quando vengono utilizzate esche con una maggiore somiglianza con gli attivi. Tuttavia, questo studio mirava ad esaminare non le prestazioni predittive dell’algoritmo di docking di per sé, ma come gli stati di protonazione dell’istidina influenzano le prestazioni relative in VS.

I ligandi attivi dockati e l’analogo del prodotto sono stati esaminati inizialmente per caratterizzare le interazioni importanti nel sito di legame RmlC. In tutti i modelli di recettore, le interazioni idrofobiche pi-pi stacking contribuiscono significativamente al punteggio di docking dei composti attivi nel sito attivo di RmlC. Il composto iniziale colpito da HTS, SID7975595, è classificato in alto nella maggior parte dei modelli di recettore, tra l’8° e il 51° posto in 26 recettori su 36. Anche se c’è solo una limitata somiglianza strutturale tra SID7975595 e il co-cristallo ligando TRH, l’anello triciclico di SID7975595 sostituisce prontamente la timidina moiety di TRH, mentre l’anello benzimidazolone sostituisce la moiety di ramnosio, fornendo la base strutturale dell’inibizione. Come mostrato in Fig. 3, l’interazione idrofobica tra gli attivi e il recettore spesso coinvolge Tyr132 e Tyr138 dalla catena A e Phe26 dalla catena B (si noti che una parte della catena B si intromette nel sito attivo della catena A). Attraverso l’interazione con i residui essenziali del sito di legame e impedendo alle molecole d’acqua di accedere a Phe26 e Tyr132, gli attivi forniscono abbondanti contatti idrofobici per raggiungere l’alta affinità di legame. Come discusso in Sivendran et al. , la sostituzione del gruppo etilico attaccato all’azoto sull’anello triciclico di SID7975595 con un gruppo allilico (ad esempio, il composto attivo 77074) migliora ulteriormente l’affinità di legame formando un sigillo idrofobico ancora più stretto. In confronto, la sostituzione di questo gruppo con un gruppo metilico più piccolo o un atomo di idrogeno risulta in una minore affinità di legame. Oltre ai contatti idrofobici descritti sopra, alcuni degli attivi formano anche legami idrogeno con Ser51, Arg59 e Arg170. Una figura che descrive le interazioni degli attivi agganciati può essere trovata nella risorsa online 3.

Fig. 3

L’interazione prevista del composto iniziale SID7975595 con HID62 capovolto e HIP119 nel modello 23 del recettore. In generale, gli attivi non hanno forti interazioni con His62 o His119, ma la variazione degli stati di protonazione dell’istidina ha un effetto profondo sui risultati classificati. Interazioni favorevoli sono osservate con altri residui del sito di legame, come Tyr132 e Tyr138 come raffigurato qui

Interessante, gli attivi generalmente non raggiungono interazioni polari con His62 e His119. Come mostrato in Fig. 3, l’ossigeno carbonilico e i due nitrogeni del benzimidazolone di SID7975595 sono rivolti lontano da His62 e His119. La direzione degli idrogeni aromatici degli attivi è spesso incapace di partecipare a reti di legame a idrogeno con le due istidine. Tuttavia, i diversi stati di protonazione e rotameria di queste istidine influenzano i risultati del VS attraverso le loro interazioni con le esche.

Valutazione delle differenze nel ranking

Non è raro che solo il primo 1% dei composti schermati possa essere testato sperimentalmente in uno studio VS, a causa delle risorse limitate. Pertanto, la metrica del fattore di arricchimento (EF1%), che riflette le prestazioni di arricchimento del database nel top 1 % (20 composti agganciati) di una libreria, diventa particolarmente rilevante nella valutazione del potere predittivo di VS. L’EF1% varia da 0 a 80 per 36 modelli di recettore (Tabella 1), indicando che i risultati del VS sono sensibili agli stati di protonazione e rotamerici di His62 e His119 di RmlC. Tuttavia, 28 su 36 recettori classificano più di otto attivi all’interno del top 10 % nel VS, come riflesso dal EF10% (Tabella 1), suggerendo che la maggior parte dei recettori sono in grado di distinguere gli attivi e le esche quando viene considerata una porzione più grande (10 %) del database. I risultati EF suggeriscono anche che i modelli di recettore con HIP62 o HIP119 tendono ad avere scarse prestazioni di arricchimento, probabilmente a causa delle estese reti di legame a idrogeno con le esche, come discusso più avanti.

L’area sotto la curva caratteristica operativa del ricevitore (AUC) per ogni modello di recettore è stato valutato per riportare le prestazioni di arricchimento dei modelli su diversi stati protonazione e rotamerici di His62 e His119. Come mostrato nella Fig. 4a e nella tabella 1, i valori AUC di tutti i modelli di recettore vanno da 0,868 a 0,996, indicando una buona prestazione predittiva complessiva (un AUC di 0,5 corrisponde a nessuna differenziazione tra gli attivi e le esche). In generale, il risultato AUC è complementare alla valutazione EF per le prestazioni predittive dei recettori. Riassumendo la tabella 1, la Fig. 4c mostra come la gamma delle prestazioni del recettore dipenda dai due stati di protonazione dell’istidina e di rotameria. Considerando l’intervallo 25-75 % delle AUC (Fig. 4c, indicato dalle linee più spesse), i modelli His62 mostrano una variazione maggiore tra gli stati His119. I modelli His119, d’altra parte, hanno una performance più coerente indipendentemente dagli stati di protonazione di His62, con l’eccezione dello stato HIP. Questo indica che i diversi stati di protonazione di His62 hanno un’influenza minore di quelli di His119 sulla performance del recettore nel nostro screening.

Fig. 4

a Valori AUC di 36 modelli di recettore. Gli stati di protonazione e di rotameria sono marcati per ogni istidina. Gli stati capovolti sono contrassegnati dalla lettera F. Il colore più scuro indica un AUC più alto e una migliore prestazione predittiva del modello di recettore corrispondente. b Percentuale media di legame a idrogeno dei primi 1 % dei composti in 36 corse VS. Protonazione e stati rotamerici sono contrassegnati per ogni istidina. Il colore più chiaro indica una maggiore percentuale di legame a idrogeno, con unità % per la barra dei colori. Il R2 per la correlazione tra l’AUCs e la percentuale media di legame a idrogeno per ogni corsa VS è 0,42 (vedi Risorsa online 4 per il grafico di dispersione). c Dipendenza delle prestazioni del recettore su His62 (in alto) e His119 (in basso). La mediana dei valori AUC di ogni stato protonazione è mostrato con grande linea orizzontale. Le piccole tacche in ogni modello di istidina segnano sei diversi stati di protonazione dell’altra istidina. Le linee verticali più spesse rappresentano il 25-75 % dell’intervallo delle AUC. I migliori modelli di recettore sono mostrati esplicitamente con gli stati di protonazione dei modelli

Una più forte dipendenza dell’arricchimento dagli stati di protonazione di His119 si osserva nei modelli HIE62 e HIP62. Con lo stato HIE62, i modelli con HIP119 capovolto (modello 6) e HIE119 capovolto (modello 2) danno le più alte prestazioni del recettore. I modelli 3 e 5 con HID119 e HIP119, rispettivamente, portano al peggior arricchimento. Nell’esaminare perché lo stato HIE62 ha la più grande variazione di AUCs, si scopre che His62 ha o pi-pi stacking o nessuna interazione con i ligandi, e fa solo pochi legami a idrogeno con esche di alto rango. Pertanto, le prestazioni del recettore dipendono dall’interazione di His119 con le esche. Questo si vede anche quando si esamina l’ampia gamma di prestazioni degli AUC dei modelli HIP62. Le reti di legame idrogeno con le esche saranno discusse più avanti nella sezione seguente.

Per valutare la significatività statistica della differenza dei valori AUC tra una coppia di modelli di recettore, abbiamo eseguito un test p a due lati al livello del 95% sull’ipotesi nulla che la coppia ha valori AUC statisticamente comparabili, contro l’ipotesi alternativa che la loro differenza nei valori AUC e potere predittivo è statisticamente significativa. Il risultato è mostrato nella tabella 1 delle risorse online, con i valori di p inferiori a 0,05 sottolineati. In media, i recettori hanno più di 16 valori p meno di 0,05, dimostrando la sensibilità di VS sulla protonazione dell’istidina e gli stati rotamerici. Come ci si potrebbe aspettare, i recettori con le differenze più significative corrispondono ai modelli con i valori AUC più alti (modello 6) o più bassi (modelli 3, 29 e 5). Il modello 6 è statisticamente migliore nel classificare gli attivi rispetto alle esche rispetto agli altri 26 recettori dell’insieme. I modelli 3, 29 e 5 sono nettamente peggiori nel classificare gli attivi rispetto a 29, 25 e 31 altri recettori, rispettivamente.

L’analisi quantitativa delle interazioni di legame a idrogeno è stata effettuata per il top 1 % (20 composti agganciati) di ogni risultato VS per rendere conto delle abbondanti interazioni di legame a idrogeno con i residui del sito di legame spesso osservati con le esche. I risultati indicano una correlazione inversa tra il contributo del legame a idrogeno e le prestazioni del recettore. La figura 4b mostra la percentuale media di legame a idrogeno di ogni modello di recettore per i primi 1 % dei composti agganciati. La percentuale di legame a idrogeno è definita come la porzione del termine di legame a idrogeno di Glide XP nel punteggio totale di docking. Il confronto delle Fig. 4a, b rivela la relazione inversa tra la percentuale di legame a idrogeno e l’AUC con un R2 di 0,42 (y = -56,18x + 67,95, la correlazione è tracciata nella risorsa online 4). La relazione inversa è comunemente osservata con i modelli con HIP119, HIP119 capovolto, o HID62, dove l’alta percentuale di legame a idrogeno ha portato ad un arricchimento povero. Per esempio, il modello di recettore 29 con HIP62 e HIP119, dove entrambe le istidine che presentano il sito attivo rivolto verso i donatori di legami a idrogeno, ha uno dei peggiori AUCs a causa dell’alta percentuale di legami a idrogeno nei top hits.

In particolare, il potenziale di legame a idrogeno di His119 spesso determina la performance del recettore. Per esempio, il modello con HID62 e HIP119 era un outlier tra i modelli HID62 in Fig. 4c, con un arricchimento notevolmente basso rispetto alle buone prestazioni generali degli altri cinque modelli HID62. I modelli HID62 hanno un elevato AUC mediano di 0,989, nonostante il frequente legame a idrogeno con le esche di HID62. Ciò è dovuto agli stati His119 che raggiungono poche interazioni di legame a idrogeno con le esche. Solo con lo stato HIP119 il modello HID62 realizza legami a idrogeno con un certo numero di esche, con conseguente AUC relativamente bassa. Questa osservazione concorda con la più forte dipendenza delle prestazioni del recettore dagli stati di protonazione di His119, come discusso sopra. Risorsa online 4 descrive la distribuzione AUC e la percentuale di legame a idrogeno con la direzione del donatore o accettore di legame a idrogeno da due istidine di fronte al recettore.

Le analisi precedenti evidenziano l’effetto ostacolante del legame a idrogeno alle esche sul potere predittivo di VS, a causa delle varie coordinate di due istidine con protonazione diversa e stati rotamerici. La dispersione della correlazione osservata con l’R2 di 0,42 è probabilmente attribuita a diverse cause, tra cui la natura chimica del dataset di esche, così come le leggere differenze di geometria di ogni recettore al momento della minimizzazione nella preparazione iniziale della proteina. Mostrando chiaramente la sensibilità dei risultati di screening virtuale su diversi stati di protonazione e rotameric di istidine nel sito attivo, sottolineiamo che la cura dovrebbe essere presa quando si preparano le coordinate atomiche di un recettore per VS, in particolare considerando le proprietà generali dei ligandi in fase di screening. Ciò include la presa in considerazione del legame a idrogeno al ligando co-cristallo e il suo effetto sulla preparazione della proteina, così come un’analisi completa delle reti prossimali di legame a idrogeno. Questo si ottiene di solito esaminando i risultati dei pacchetti software di predizione del pKa ampiamente utilizzati, e a questo punto, abbiamo confrontato i risultati di diversi pacchetti relativi ai nostri risultati VS e li discutiamo ulteriormente.

Dock delle esche

Vari fattori portano a differenze di classificazione tra i recettori, in particolare per quanto riguarda le esche. In generale, le esche che si sono classificate più in alto rispetto agli attivi erano di alto peso molecolare e avevano più potenziale di avere legami a idrogeno con il recettore. In questa sezione, analizziamo ulteriormente i modelli di interazione frequenti osservati tra le esche e il recettore, con un focus sui modelli di recettore con scarso arricchimento.

Le esche tendono ad avere un peso molecolare maggiore e più strutture ad anello rispetto agli attivi (Tabella 2). Questo si traduce in un posizionamento più alto delle esche, a causa delle interazioni idrofobiche in assenza di legami idrogeno al recettore. La Figura 5a mostra le interazioni idrofobiche ottenute attraverso il grande composto inattivo 16952387 nel modello 19 del recettore. Questo composto è spesso classificato entro i primi cinque in molte corse VS per la sua sostanziale pi-pi stacking interazioni con Phe26, Tyr132, e Tyr138. Questa tendenza è frequentemente osservata nello screening virtuale dove le molecole più grandi si classificano meglio come risultato delle interazioni estese con il recettore.

Tabella 2 Confronto tra peso molecolare, numero di donatori di legami a idrogeno e numero di accettatori di legami a idrogeno per gli attivi e le esche
Fig. 5

a Interazione del composto inattivo 16952387 con HID62 capovolto e HIE119 nel modello del recettore 19. Il composto non ha interazione con nessuna delle due istidine. Pi-pi stacking interazioni con Phe26 dalla catena B, Tyr132, e Tyr138 contribuire al suo alto rango, insieme a legami a idrogeno con Arg23, Arg59, Arg170, e Ser51 (non mostrato). b Interazione del composto inattivo 17388064 con HIE62 e HID119 nel modello 3 recettore. Entrambe le istidine forniscono legami a idrogeno al composto

La performance di arricchimento è particolarmente bassa per i recettori che forniscono abbondanti reti di legame a idrogeno alle esche. Le interazioni attraverso His62 e His119 non sono state ampiamente osservate per gli attivi, e quindi i composti con maggiori contributi entalpici si classificano erroneamente più favorevolmente. Un esempio mostrato in Fig. 5b raffigura l’interazione del composto inattivo 17388064 nel modello di recettore 3 (AUC 0.868), classificato come primo. In questo recettore, che è il peggiore nel classificare i composti in base all’AUC, il composto 17388064 forma due legami a idrogeno con due istidine, uno tra il suo idrogeno idrossile e il δ-nitrogeno di HIE62 e l’altro tra il suo ossigeno idrossile e l’idrogeno sul δ-nitrogeno di HID119. Questo composto ha cinque donatori di legami a idrogeno e nove accettatori, un numero elevato rispetto alle rispettive medie di quelli delle esche e degli attivi (Tabella 2). Pertanto, con un elevato contributo di legame a idrogeno al punteggio totale del 34,7 ± 6,62%, questo composto esca è frequentemente osservato per formare almeno un legame a idrogeno con una delle due istidine, ottenendo così alti ranghi in più corse VS.

Due altri modelli di recettore, il modello 29 con HIP62 e HIP119 e il modello 5 con HIE62 e HIP119, mostrano modelli di interazione simili alle esche come modello 3. Questi tre modelli hanno i valori AUC più bassi, con una media di 0,870 tra loro. Come discusso in precedenza, i loro valori AUC differiscono significativamente dagli altri recettori, riflettendo la sottile relazione tra i legami a idrogeno raggiunti attraverso His62 e His119 e lo scarso arricchimento. Un’ulteriore figura che descrive le reti di legami a idrogeno tra le esche e i recettori è fornita nella risorsa online 5.

previsione di pKa per His62 e His119

I nostri risultati dimostrano chiaramente la sensibilità dello screening virtuale sulla protonazione dell’istidina e sugli stati rotamerici. In molti studi biofisici computazionali, gli stati di protonazione dei residui titolabili sono determinati utilizzando vari programmi di predizione del pKa. Per valutare le prestazioni di questi programmi per identificare il modello di recettore con il miglior potere predittivo nel docking, abbiamo confrontato i risultati di previsione pKa di His62 e His119 da PROPKA, Maestro, H++ e MCCE, come mostrato nella tabella 3 con i valori pKa calcolati.

Tabella 3 Confronto delle predizioni per gli stati di protonazione di His62 e His119 di RmlC fatte dai software comunemente usati, con i valori di pKa calcolati

In primo luogo, PROPKA 3.1 predice che sia His62 che His119 sono neutri indipendentemente dalla presenza di TRH durante la preparazione. Il programma, tuttavia, non può assegnare gli stati rotamerici delle istidine. Pertanto, uno stato di HID, flipped HID, HIE, o flipped HIE deve essere determinato manualmente. Simile a PROPKA, il programma H++, che usa un’elettrostatica del continuo a struttura singola, trova anche che entrambe le istidine sono neutre, anche se i valori pKa previsti sono diversi da quelli di PROPKA. Il programma MCCE, che è basato sull’elettrostatica del continuo multi-conformazione, predice che His62 è neutro mentre His119 è protonato.

In seguito, abbiamo usato il Protein Preparation Wizard in Maestro per calcolare la pKa di His62 e His119 con e senza TRH. Si noti che Maestro è in grado di variare gli stati rotamerici, mentre PROPKA non può. Un recente aggiornamento permette a Maestro di impiegare PROPKA nella sua previsione di pKa invece di Epik. Con Epik, Maestro predice sia His62 che His119 in stati doppiamente protonati, indipendentemente dalla presenza di TRH. È interessante notare che il modello del recettore che corrisponde a questo stato multi-istidina ha il peggior potere predittivo con un AUC di 0,869. Quando si usa PROPKA, HIP62 e HIE119 sono predetti per il complesso proteina-TRH e HIE62 e HIE119 per la proteina apo. Queste due predizioni di PROPKA in Maestro corrispondono ai modelli di moderata performance di arricchimento, con AUCs di 0.971 per il modello 25 (HIP62 e HIE119) e 0.942 per il modello 1 (HIE62 e HIE119), rispettivamente.

Dato che le previsioni di cui sopra fatte da diversi software variano significativamente l’una dall’altra, dovrebbe essere presa cautela quando si utilizzano questi risultati come una linea guida per preparare una proteina per lo screening virtuale. Senza una conoscenza intima del vero stato di protonazione del recettore così come i ligandi in fase di screening, è difficile affrontare questo problema. Pertanto, suggeriamo che un’analisi su piccola scala, come quella eseguita in questo studio, e il confronto con i dati sperimentali, se disponibili, potrebbe fornire una descrizione più accurata della protonazione e degli stati rotamerici dei residui titolabili nei recettori delle proteine per futuri screening su larga scala. In alternativa, un modello che include l’incorporazione esplicita della protonazione della catena laterale alternativa e degli stati rotamerici durante il docking, potenzialmente con informazioni memorizzate nella griglia come esiste per gli idrossili e i tioli ruotabili in Glide, potrebbe valere la pena perseguire. L’esame dei risultati rispetto agli stati di protonazione e le classifiche basate sulle interazioni con le istidine dovrebbero essere attentamente esaminate prima di procedere a test sperimentali.

Inoltre, la flessibilità del recettore probabilmente influenzerà gli stati di protonazione dei residui ionizzabili. Mentre questo non è stato esplicitamente studiato qui, a parte la minimizzazione di ogni recettore dopo l’assegnazione degli stati di protonazione, la flessibilità della proteina è chiaramente importante per la progettazione e lo sviluppo dei farmaci. Considerando lo spazio conformazionale e protonazione in congiunzione diventa rapidamente intrattabile con metodi fisici come quelli descritti qui, ma i metodi di campionamento migliorati mostrano la promessa nell’affrontare tali difficoltà. Questo include simulazioni di dinamica molecolare a pH costante, per le quali il pH è una variabile termodinamica esterna, utilizzata per la previsione alla cieca dei valori pKa dei residui titolabili. Applicare efficacemente i risultati di queste simulazioni alla progettazione molecolare è un’area di interesse in corso. Gli insiemi di equilibrio di tali simulazioni possono essere utilizzati insieme al docking come applicazione dello schema complesso rilassato, dove lo screening virtuale è condotto con un insieme di strutture diversamente protonate, per migliorare i risultati di arricchimento. Prendendo in considerazione la flessibilità del recettore nella preparazione dell’obiettivo porterà ad un campionamento più ampio dello spazio conformazionale e protonazione, migliorando così le prestazioni di VS.

.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.