Al fine di valutare l’effetto della protonazione dell’istidina e degli stati rotamerici sulle prestazioni predittive dei recettori, abbiamo eseguito lo screening virtuale (VS) per l’enzima Mtb RmlC basato sui risultati di un precedente studio di high-throughput screening (HTS). Di seguito, esamineremo prima le interazioni tipiche del co-cristallo ligando TRH per sondare la dipendenza della posa del ligando dalla protonazione dell’istidina. Abbiamo ulteriormente contestualizzare l’analisi delle prestazioni di arricchimento e il potere predittivo di vari modelli di recettore, discutendo le interazioni con il recettore per mostrare l’effetto di diversi stati di protonazione istidina su VS. Infine, confrontiamo i valori pKa previsti calcolati da diversi pacchetti di calcolo pKa comuni agli stati di protonazione del recettore con il miglior potere predittivo.
Docking di TRH
Docking del ligando co-cristallo TRH in 36 modelli di recettore è stato effettuato per mostrare la posa, o orientamento del ligando rispetto al recettore, dipendenza dalla protonazione dell’istidina e dagli stati rotamerici. I modelli di legame a idrogeno chimicamente intuitivi per le coordinate cristalline di His62 e His119, mostrati in Fig. 2b, implicano la potenziale importanza dei legami a idrogeno nel docking di TRH. Il docking di questo ligando ha permesso di esaminare preliminarmente la dipendenza della posa dalle possibili reti di legame a idrogeno con il recettore.
La variazione degli stati di protonazione dell’istidina ha un chiaro effetto sulla predizione della posa per il ligando co-cristallo determinato. La RMSD della posizione di docking del TRH auto-dockato nelle coordinate del cristallo per diversi stati di protonazione e rotamerici di His62 e His119 varia da 2,91 a 5,44 Å. Lo stato di protonazione di entrambe le istidine con la migliore RMSD media è HIE, che concorda con gli stati di protonazione più probabili delle coordinate del cristallo del TRH. Inoltre, in tutti i casi l’algoritmo di docking predice correttamente la posizione del pirofosfato del ligando, ma la grande deviazione dalle coordinate del cristallo deriva principalmente dal capovolgimento delle società di timidina e ramnosio intorno al pirofosfato, con conseguenti diversi modelli di legame a idrogeno tra TRH e due istidine. Questo indica l’importanza delle reti di legame a idrogeno con His62 e His119 nella predizione della posa del co-cristallo ligando TRH. Pertanto, dopo aver esaminato la dipendenza della posizione dai legami a idrogeno forniti da due istidine, abbiamo ampliato il nostro studio per esaminare sistematicamente i composti di classificazione in VS e come è influenzato dalla protonazione e dagli stati rotamerici delle istidine.
Selezione virtuale
Il docking molecolare è stato effettuato per esaminare la dipendenza della classificazione dei composti dalla protonazione dell’istidina e dagli stati rotomerici. Il set di ligandi includeva dieci attivi e 2.000 inattivi selezionati a caso da un HTS. Notiamo che i punteggi di Tanimoto indicano che la maggior parte delle nostre esche hanno una bassa somiglianza con gli attivi. Un tale set di esche presenta una sfida minore per l’algoritmo di docking e le prestazioni predittive di VS stesso possono essere influenzate quando vengono utilizzate esche con una maggiore somiglianza con gli attivi. Tuttavia, questo studio mirava ad esaminare non le prestazioni predittive dell’algoritmo di docking di per sé, ma come gli stati di protonazione dell’istidina influenzano le prestazioni relative in VS.
I ligandi attivi dockati e l’analogo del prodotto sono stati esaminati inizialmente per caratterizzare le interazioni importanti nel sito di legame RmlC. In tutti i modelli di recettore, le interazioni idrofobiche pi-pi stacking contribuiscono significativamente al punteggio di docking dei composti attivi nel sito attivo di RmlC. Il composto iniziale colpito da HTS, SID7975595, è classificato in alto nella maggior parte dei modelli di recettore, tra l’8° e il 51° posto in 26 recettori su 36. Anche se c’è solo una limitata somiglianza strutturale tra SID7975595 e il co-cristallo ligando TRH, l’anello triciclico di SID7975595 sostituisce prontamente la timidina moiety di TRH, mentre l’anello benzimidazolone sostituisce la moiety di ramnosio, fornendo la base strutturale dell’inibizione. Come mostrato in Fig. 3, l’interazione idrofobica tra gli attivi e il recettore spesso coinvolge Tyr132 e Tyr138 dalla catena A e Phe26 dalla catena B (si noti che una parte della catena B si intromette nel sito attivo della catena A). Attraverso l’interazione con i residui essenziali del sito di legame e impedendo alle molecole d’acqua di accedere a Phe26 e Tyr132, gli attivi forniscono abbondanti contatti idrofobici per raggiungere l’alta affinità di legame. Come discusso in Sivendran et al. , la sostituzione del gruppo etilico attaccato all’azoto sull’anello triciclico di SID7975595 con un gruppo allilico (ad esempio, il composto attivo 77074) migliora ulteriormente l’affinità di legame formando un sigillo idrofobico ancora più stretto. In confronto, la sostituzione di questo gruppo con un gruppo metilico più piccolo o un atomo di idrogeno risulta in una minore affinità di legame. Oltre ai contatti idrofobici descritti sopra, alcuni degli attivi formano anche legami idrogeno con Ser51, Arg59 e Arg170. Una figura che descrive le interazioni degli attivi agganciati può essere trovata nella risorsa online 3.
Interessante, gli attivi generalmente non raggiungono interazioni polari con His62 e His119. Come mostrato in Fig. 3, l’ossigeno carbonilico e i due nitrogeni del benzimidazolone di SID7975595 sono rivolti lontano da His62 e His119. La direzione degli idrogeni aromatici degli attivi è spesso incapace di partecipare a reti di legame a idrogeno con le due istidine. Tuttavia, i diversi stati di protonazione e rotameria di queste istidine influenzano i risultati del VS attraverso le loro interazioni con le esche.
Valutazione delle differenze nel ranking
Non è raro che solo il primo 1% dei composti schermati possa essere testato sperimentalmente in uno studio VS, a causa delle risorse limitate. Pertanto, la metrica del fattore di arricchimento (EF1%), che riflette le prestazioni di arricchimento del database nel top 1 % (20 composti agganciati) di una libreria, diventa particolarmente rilevante nella valutazione del potere predittivo di VS. L’EF1% varia da 0 a 80 per 36 modelli di recettore (Tabella 1), indicando che i risultati del VS sono sensibili agli stati di protonazione e rotamerici di His62 e His119 di RmlC. Tuttavia, 28 su 36 recettori classificano più di otto attivi all’interno del top 10 % nel VS, come riflesso dal EF10% (Tabella 1), suggerendo che la maggior parte dei recettori sono in grado di distinguere gli attivi e le esche quando viene considerata una porzione più grande (10 %) del database. I risultati EF suggeriscono anche che i modelli di recettore con HIP62 o HIP119 tendono ad avere scarse prestazioni di arricchimento, probabilmente a causa delle estese reti di legame a idrogeno con le esche, come discusso più avanti.
L’area sotto la curva caratteristica operativa del ricevitore (AUC) per ogni modello di recettore è stato valutato per riportare le prestazioni di arricchimento dei modelli su diversi stati protonazione e rotamerici di His62 e His119. Come mostrato nella Fig. 4a e nella tabella 1, i valori AUC di tutti i modelli di recettore vanno da 0,868 a 0,996, indicando una buona prestazione predittiva complessiva (un AUC di 0,5 corrisponde a nessuna differenziazione tra gli attivi e le esche). In generale, il risultato AUC è complementare alla valutazione EF per le prestazioni predittive dei recettori. Riassumendo la tabella 1, la Fig. 4c mostra come la gamma delle prestazioni del recettore dipenda dai due stati di protonazione dell’istidina e di rotameria. Considerando l’intervallo 25-75 % delle AUC (Fig. 4c, indicato dalle linee più spesse), i modelli His62 mostrano una variazione maggiore tra gli stati His119. I modelli His119, d’altra parte, hanno una performance più coerente indipendentemente dagli stati di protonazione di His62, con l’eccezione dello stato HIP. Questo indica che i diversi stati di protonazione di His62 hanno un’influenza minore di quelli di His119 sulla performance del recettore nel nostro screening.
Una più forte dipendenza dell’arricchimento dagli stati di protonazione di His119 si osserva nei modelli HIE62 e HIP62. Con lo stato HIE62, i modelli con HIP119 capovolto (modello 6) e HIE119 capovolto (modello 2) danno le più alte prestazioni del recettore. I modelli 3 e 5 con HID119 e HIP119, rispettivamente, portano al peggior arricchimento. Nell’esaminare perché lo stato HIE62 ha la più grande variazione di AUCs, si scopre che His62 ha o pi-pi stacking o nessuna interazione con i ligandi, e fa solo pochi legami a idrogeno con esche di alto rango. Pertanto, le prestazioni del recettore dipendono dall’interazione di His119 con le esche. Questo si vede anche quando si esamina l’ampia gamma di prestazioni degli AUC dei modelli HIP62. Le reti di legame idrogeno con le esche saranno discusse più avanti nella sezione seguente.
Per valutare la significatività statistica della differenza dei valori AUC tra una coppia di modelli di recettore, abbiamo eseguito un test p a due lati al livello del 95% sull’ipotesi nulla che la coppia ha valori AUC statisticamente comparabili, contro l’ipotesi alternativa che la loro differenza nei valori AUC e potere predittivo è statisticamente significativa. Il risultato è mostrato nella tabella 1 delle risorse online, con i valori di p inferiori a 0,05 sottolineati. In media, i recettori hanno più di 16 valori p meno di 0,05, dimostrando la sensibilità di VS sulla protonazione dell’istidina e gli stati rotamerici. Come ci si potrebbe aspettare, i recettori con le differenze più significative corrispondono ai modelli con i valori AUC più alti (modello 6) o più bassi (modelli 3, 29 e 5). Il modello 6 è statisticamente migliore nel classificare gli attivi rispetto alle esche rispetto agli altri 26 recettori dell’insieme. I modelli 3, 29 e 5 sono nettamente peggiori nel classificare gli attivi rispetto a 29, 25 e 31 altri recettori, rispettivamente.
L’analisi quantitativa delle interazioni di legame a idrogeno è stata effettuata per il top 1 % (20 composti agganciati) di ogni risultato VS per rendere conto delle abbondanti interazioni di legame a idrogeno con i residui del sito di legame spesso osservati con le esche. I risultati indicano una correlazione inversa tra il contributo del legame a idrogeno e le prestazioni del recettore. La figura 4b mostra la percentuale media di legame a idrogeno di ogni modello di recettore per i primi 1 % dei composti agganciati. La percentuale di legame a idrogeno è definita come la porzione del termine di legame a idrogeno di Glide XP nel punteggio totale di docking. Il confronto delle Fig. 4a, b rivela la relazione inversa tra la percentuale di legame a idrogeno e l’AUC con un R2 di 0,42 (y = -56,18x + 67,95, la correlazione è tracciata nella risorsa online 4). La relazione inversa è comunemente osservata con i modelli con HIP119, HIP119 capovolto, o HID62, dove l’alta percentuale di legame a idrogeno ha portato ad un arricchimento povero. Per esempio, il modello di recettore 29 con HIP62 e HIP119, dove entrambe le istidine che presentano il sito attivo rivolto verso i donatori di legami a idrogeno, ha uno dei peggiori AUCs a causa dell’alta percentuale di legami a idrogeno nei top hits.
In particolare, il potenziale di legame a idrogeno di His119 spesso determina la performance del recettore. Per esempio, il modello con HID62 e HIP119 era un outlier tra i modelli HID62 in Fig. 4c, con un arricchimento notevolmente basso rispetto alle buone prestazioni generali degli altri cinque modelli HID62. I modelli HID62 hanno un elevato AUC mediano di 0,989, nonostante il frequente legame a idrogeno con le esche di HID62. Ciò è dovuto agli stati His119 che raggiungono poche interazioni di legame a idrogeno con le esche. Solo con lo stato HIP119 il modello HID62 realizza legami a idrogeno con un certo numero di esche, con conseguente AUC relativamente bassa. Questa osservazione concorda con la più forte dipendenza delle prestazioni del recettore dagli stati di protonazione di His119, come discusso sopra. Risorsa online 4 descrive la distribuzione AUC e la percentuale di legame a idrogeno con la direzione del donatore o accettore di legame a idrogeno da due istidine di fronte al recettore.
Le analisi precedenti evidenziano l’effetto ostacolante del legame a idrogeno alle esche sul potere predittivo di VS, a causa delle varie coordinate di due istidine con protonazione diversa e stati rotamerici. La dispersione della correlazione osservata con l’R2 di 0,42 è probabilmente attribuita a diverse cause, tra cui la natura chimica del dataset di esche, così come le leggere differenze di geometria di ogni recettore al momento della minimizzazione nella preparazione iniziale della proteina. Mostrando chiaramente la sensibilità dei risultati di screening virtuale su diversi stati di protonazione e rotameric di istidine nel sito attivo, sottolineiamo che la cura dovrebbe essere presa quando si preparano le coordinate atomiche di un recettore per VS, in particolare considerando le proprietà generali dei ligandi in fase di screening. Ciò include la presa in considerazione del legame a idrogeno al ligando co-cristallo e il suo effetto sulla preparazione della proteina, così come un’analisi completa delle reti prossimali di legame a idrogeno. Questo si ottiene di solito esaminando i risultati dei pacchetti software di predizione del pKa ampiamente utilizzati, e a questo punto, abbiamo confrontato i risultati di diversi pacchetti relativi ai nostri risultati VS e li discutiamo ulteriormente.
Dock delle esche
Vari fattori portano a differenze di classificazione tra i recettori, in particolare per quanto riguarda le esche. In generale, le esche che si sono classificate più in alto rispetto agli attivi erano di alto peso molecolare e avevano più potenziale di avere legami a idrogeno con il recettore. In questa sezione, analizziamo ulteriormente i modelli di interazione frequenti osservati tra le esche e il recettore, con un focus sui modelli di recettore con scarso arricchimento.
Le esche tendono ad avere un peso molecolare maggiore e più strutture ad anello rispetto agli attivi (Tabella 2). Questo si traduce in un posizionamento più alto delle esche, a causa delle interazioni idrofobiche in assenza di legami idrogeno al recettore. La Figura 5a mostra le interazioni idrofobiche ottenute attraverso il grande composto inattivo 16952387 nel modello 19 del recettore. Questo composto è spesso classificato entro i primi cinque in molte corse VS per la sua sostanziale pi-pi stacking interazioni con Phe26, Tyr132, e Tyr138. Questa tendenza è frequentemente osservata nello screening virtuale dove le molecole più grandi si classificano meglio come risultato delle interazioni estese con il recettore.