Pentru a evalua efectul protonării histidinei și al stărilor rotamerice asupra performanței predictive a receptorilor, am efectuat un screening virtual (VS) pentru enzima RmlC din Mtb pe baza rezultatelor unui studiu anterior de screening de mare capacitate (HTS). Mai jos, vom examina mai întâi interacțiunile tipice ale ligandului co-cristal TRH pentru a sonda dependența poziției ligandului de protonarea histidinei. În continuare, contextualizăm analiza performanței de îmbogățire și a puterii de predicție a diferitelor modele de receptori, discutând interacțiunile cu receptorul pentru a arăta efectul diferitelor stări de protonare a histidinei asupra VS. În cele din urmă, comparăm valorile pKa previzionate calculate de mai multe pachete comune de calcul pKa cu stările de protonare a receptorului cu cea mai bună putere de predicție.
Docking of TRH
Docking the co-crystal ligand TRH back into 36 receptor models was carried out to show the pose, or ligand orientation relative to the receptor, dependence on histidine protonation and rotameric states. Modelele de legături de hidrogen intuitive din punct de vedere chimic pentru coordonatele cristaline ale His62 și His119, prezentate în Fig. 2b, implică semnificația potențială a legăturilor de hidrogen în andocarea TRH. Docking-ul acestui ligand a permis examinarea preliminară a dependenței poziției de posibilele rețele de legături de hidrogen cu receptorul.
Variația stărilor de protonare a histidinei are un efect clar asupra predicției poziției pentru ligandul determinat pe cocristal. RMSD a pozitiei de andocare a TRH auto-andocat în coordonatele cristaline pentru diferite stări de protonare și rotamerice ale His62 și His119 a variat de la 2,91 la 5,44 Å. Starea de protonare a ambelor histidine cu cea mai bună medie RMSD este HIE, care concordă cu cele mai probabile stări de protonare ale coordonatelor cristaline ale TRH. De asemenea, în toate cazurile, algoritmul de andocare prezice corect poziția pirofosfatului ligandului, dar abaterea mare de la coordonatele cristaline provine în principal din răsturnarea fracțiunilor de timidină și ramnoză în jurul pirofosfatului, ceea ce duce la modele diferite de legături de hidrogen între TRH și cele două histidine. Acest lucru indică importanța rețelelor de legături de hidrogen cu His62 și His119 în predicția poziției ligandului TRH din cocristal. Prin urmare, după ce am examinat dependența posei de legăturile de hidrogen furnizate de două histidine, am extins studiul nostru pentru a examina sistematic clasificarea compușilor în VS și modul în care aceasta este afectată de stările de protonare și rotamerice ale histidinelor.
Screening virtual
Amplasarea moleculară a fost efectuată pentru a examina dependența clasificării compușilor de stările de protonare și rotamerice ale histidinei. Setul de liganzi a inclus zece activi și 2.000 de inactivi selectați la întâmplare dintr-un HTS. Observăm că scorurile Tanimoto indică faptul că majoritatea momelilor noastre au o similitudine scăzută cu substanțele active. Un astfel de set de momeli reprezintă o provocare mai mică pentru algoritmul de andocare, iar performanța predictivă a VS poate fi afectată atunci când se utilizează momeli cu o similitudine mai mare cu substanțele active. Cu toate acestea, acest studiu a urmărit să examineze nu performanța predictivă a algoritmului de andocare în sine, ci modul în care stările de protonare a histidinei afectează performanța relativă în VS.
Liganzii activi andocați și analogul produsului au fost examinați inițial pentru a caracteriza interacțiunile importante din situsul de legare RmlC. În toate modelele de receptori, interacțiunile hidrofobe de stivuire pi-pi contribuie în mod semnificativ la scorul de andocare a compușilor activi în cadrul situsului activ RmlC. Compusul de succes inițial din HTS, SID7975595, se situează la un nivel ridicat în majoritatea modelelor de receptori, între locul 8 și locul 51 în 26 din 36 de receptori. Deși există doar o similitudine structurală limitată între SID7975595 și ligandul cocristal TRH, inelul triciclic al lui SID7975595 înlocuiește cu ușurință fracțiunea de timidină a TRH, în timp ce inelul benzimidazolonic înlocuiește fracțiunea de ramnoză, furnizând baza structurală a inhibiției. După cum se arată în Fig. 3, interacțiunea hidrofobă dintre substanțele active și receptor implică adesea Tyr132 și Tyr138 din lanțul A și Phe26 din lanțul B (a se observa că o parte din lanțul B se intrudează în situsul activ al lanțului A). Prin interacțiunea cu reziduurile esențiale ale situsului de legare și prin împiedicarea accesului moleculelor de apă la Phe26 și Tyr132, substanțele active oferă contacte hidrofobe abundente pentru a obține o afinitate de legare ridicată. După cum s-a discutat în Sivendran și colab. , substituirea grupului etil atașat la azotul de pe inelul triciclic al SID7975595 cu un grup alil (de exemplu, compusul activ 77074) sporește și mai mult afinitatea de legare prin formarea unui sigiliu hidrofob și mai strâns. În comparație, înlocuirea acestei grupări cu o grupare metil mai mică sau cu un atom de hidrogen duce la o afinitate de legare mai mică . În plus față de contactele hidrofobe descrise mai sus, unele dintre substanțele active formează, de asemenea, legături de hidrogen cu Ser51, Arg59 și Arg170. O figură care descrie interacțiunile activilor andocați poate fi găsită în Resursa online 3.
Interesant este faptul că, în general, substanțele active nu realizează interacțiuni polare cu His62 și His119. După cum se arată în Fig. 3, oxigenul carbonil și cei doi nitrogeni benzimidazolonici ai SID7975595 sunt orientați în direcția opusă lui His62 și His119. Direcția hidrogenilor aromatici ai activilor este adesea incapabilă să participe la rețelele de legături de hidrogen cu cele două histidine. Cu toate acestea, stările diferite de protonare și rotamerice ale acestor histidine afectează rezultatele VS prin interacțiunile lor cu momelile.
Evaluarea diferențelor de clasificare
Nu este neobișnuit ca doar primul 1 % din compușii examinați să poată fi testați experimental într-un studiu VS, din cauza resurselor limitate. Prin urmare, metrica factorului de îmbogățire (EF)1 %, care reflectă performanța de îmbogățire a bazei de date în primul 1 % (20 de compuși andocați) dintr-o bibliotecă, devine deosebit de relevantă în evaluarea puterii de predicție a VS. EF1% variază de la 0 la 80 pentru 36 de modele de receptori (tabelul 1), ceea ce indică faptul că rezultatele VS sunt sensibile la stările de protonare și rotamerice ale His62 și His119 din RmlC. Cu toate acestea, 28 din 36 de receptori clasifică mai mult de opt active în primele 10 % din VS, așa cum reiese din EF10% (tabelul 1), ceea ce sugerează că majoritatea receptorilor sunt capabili să distingă activii și momelile atunci când se ia în considerare o parte mai mare (10 %) din baza de date. Rezultatele EF sugerează, de asemenea, că modelele de receptori cu HIP62 sau HIP119 tind să aibă performanțe slabe de îmbogățire, probabil din cauza rețelelor extinse de legături de hidrogen cu momelile, după cum se discută mai târziu.
Arie sub curba caracteristică de funcționare a receptorului (AUC) pentru fiecare model de receptor a fost evaluată pentru a raporta performanța de îmbogățire a modelelor la diferite stări de protonare și rotamerice ale His62 și His119. După cum se arată în Fig. 4a și în Tabelul 1, valorile AUC ale tuturor modelelor de receptori variază între 0,868 și 0,996, indicând o performanță predictivă bună în general (o AUC de 0,5 corespunde unei absențe de diferențiere între activi și momeli). În general, rezultatul AUC este complementar cu evaluarea EF pentru performanța predictivă a receptorilor. Rezumând tabelul 1, Fig. 4c arată modul în care intervalul de performanță a receptorului depinde de cele două stări de protonare a histidinei și de rotamerie. Luând în considerare intervalul 25-75 % al AUC-urilor (Fig. 4c, indicat de liniile mai groase), modelele His62 prezintă o variație mai mare între stările His119. Modelele His119, pe de altă parte, au o performanță mai consistentă, indiferent de stările de protonare ale His62, cu excepția stării HIP. Acest lucru indică faptul că diferitele stări de protonare ale His62 au o influență mai mică decât cele ale His119 asupra performanței receptorilor în screening-ul nostru.
O dependență mai puternică a îmbogățirii de stările de protonare ale His119 este observată în modelele HIE62 și HIP62. Cu starea HIE62, modelele cu HIP119 răsturnat (modelul 6) și HIE119 răsturnat (modelul 2) dau cea mai mare performanță a receptorului. Modelele 3 și 5 cu HID119 și HIP119, respectiv HIP119, conduc la cea mai slabă îmbogățire. Examinând de ce starea HIE62 are cea mai mare variație a AUC-urilor, se constată că His62 are fie stivuire pi-pi, fie nu are interacțiuni cu liganzii și face doar câteva legături de hidrogen cu momeli de rang înalt. Prin urmare, performanța receptorului depinde de interacțiunea lui His119 cu momelile. Acest lucru se observă, de asemenea, atunci când se examinează intervalul larg de performanță al AUC-urilor modelelor HIP62. Rețelele de legături de hidrogen cu momelile vor fi discutate mai târziu, în secțiunea următoare.
Pentru a evalua semnificația statistică a diferenței valorilor AUC între o pereche de modele de receptori, am efectuat un test p cu două fețe la nivelul de 95 % pe ipoteza nulă că perechea are valori AUC comparabile din punct de vedere statistic, față de ipoteza alternativă că diferența dintre valorile AUC și puterea de predicție a acestora este semnificativă din punct de vedere statistic. Rezultatul este prezentat în Tabelul de resurse online 1, valorile p mai mici de 0,05 fiind subliniate. În medie, receptorii au mai mult de 16 valori p mai mici de 0,05, demonstrând sensibilitatea VS la protonarea histidinei și la stările rotamerice. Așa cum era de așteptat, receptorii cu cele mai semnificative diferențe corespund modelelor cu cele mai mari (modelul 6) sau cele mai mici valori AUC (modelele 3, 29 și 5). Modelul 6 este mai bun din punct de vedere statistic la clasificarea substanțelor active față de momeli decât alți 26 de receptori din ansamblu. Modelele 3, 29 și 5 sunt în mod distinct mai slabe la clasificarea substanțelor active decât 29, 25 și, respectiv, 31 de alți receptori.
Analiza cantitativă a interacțiunilor de legătură de hidrogen a fost efectuată pentru primele 1 % (20 de compuși andocați) din fiecare rezultat VS pentru a lua în considerare interacțiunile abundente de legătură de hidrogen cu reziduurile situsului de legare observate adesea cu momelile. Rezultatele indică o corelație inversă între contribuția legăturii de hidrogen și performanța receptorului. Figura 4b prezintă procentajul mediu de legături de hidrogen al fiecărui model de receptor pentru cei mai buni 1 % dintre compușii andocați. Procentul de legături de hidrogen este definit ca fiind porțiunea termenului de legături de hidrogen Glide XP în scorul total de andocare. Comparația dintre Fig. 4a, b relevă relația inversă dintre procentul de legături de hidrogen și AUC cu un R2 de 0,42 (y = -56,18x + 67,95, corelația este reprezentată grafic în Resursa online 4). Relația inversă este observată în mod obișnuit în cazul modelelor cu HIP119, HIP119 răsturnat sau HID62, unde procentul ridicat de legături de hidrogen a dus la o îmbogățire slabă. De exemplu, modelul de receptor 29 cu HIP62 și HIP119, în care ambele histidine care prezintă donatori de legături de hidrogen orientate spre situsul activ, are una dintre cele mai proaste AUC-uri din cauza procentului ridicat de legături de hidrogen în primele rezultate.
În mod evident, potențialul de legături de hidrogen al His119 determină adesea performanța receptorului. De exemplu, modelul cu HID62 și HIP119 a fost un model aberant printre modelele HID62 din Fig. 4c, cu o îmbogățire vizibil scăzută în comparație cu performanța generală bună a celorlalte cinci modele HID62. Modelele HID62 au un AUC median ridicat de 0,989, în ciuda legăturilor frecvente de hidrogen cu momelile din HID62. Acest lucru se datorează faptului că stările His119 realizează puține interacțiuni de legătură de hidrogen cu momelile. Numai cu starea HIP119 modelul HID62 realizează legături de hidrogen cu un număr de momeli, ceea ce duce la o AUC relativ scăzută. Această observație este în concordanță cu dependența mai puternică a performanței receptorului de stările de protonare ale His119, așa cum s-a discutat mai sus. Resursa online 4 descrie distribuția AUC și procentul de legături de hidrogen împreună cu direcția de donator sau acceptor al legăturii de hidrogen de la două histidine aflate în fața receptorului.
Analizele de mai sus evidențiază efectul de împiedicare a legăturilor de hidrogen cu momelile asupra puterii de predicție a VS, datorită coordonatelor variate a două histidine cu stări de protonare și rotamerice diferite. Dispersia corelației observate cu R2 de 0,42 este probabil atribuită mai multor cauze, inclusiv naturii chimice a setului de date ale momelilor, precum și ușoarelor diferențe de geometrie ale fiecărui receptor la minimizarea în timpul preparării inițiale a proteinei. Arătând în mod clar sensibilitatea rezultatelor screening-ului virtual asupra diferitelor stări de protonare și rotamerice ale histidinelor din situsul activ, subliniem faptul că trebuie să se acorde atenție la pregătirea coordonatelor atomice ale unui receptor pentru VS, în special având în vedere proprietățile generale ale liganzilor care fac obiectul screening-ului. Aceasta include luarea în considerare a legăturii de hidrogen cu ligandul cocristal și efectul său asupra preparării proteinei, precum și o analiză cuprinzătoare a rețelelor de legături de hidrogen proximale. Acest lucru se realizează, de obicei, prin examinarea rezultatelor din pachetele software de predicție pKa utilizate pe scară largă și, până în acest moment, am comparat rezultatele din diferite pachete în raport cu rezultatele noastre VS și le discutăm în continuare.
Docking of the decoys
Diferiți factori conduc la diferențe de clasificare între receptori, în special în ceea ce privește momelile. În general, momelile care s-au clasat mai sus decât substanțele active aveau o greutate moleculară mare și aveau un potențial mai mare de a avea legături de hidrogen cu receptorul. În această secțiune, analizăm în continuare modelele de interacțiune frecvente observate între momeli și receptor, concentrându-ne asupra modelelor de receptori cu o îmbogățire slabă.
Miniștrii au tendința de a avea o greutate moleculară mai mare și mai multe structuri inelare decât cei activi (tabelul 2). Acest lucru face ca momelile să se claseze mai bine, datorită interacțiunilor hidrofobe în absența legăturilor de hidrogen cu receptorul. Figura 5a prezintă interacțiunile hidrofobe realizate prin intermediul compusului inactiv mare 16952387 în modelul de receptor 19. Acest compus este adesea clasat în primele cinci locuri în multe rulări VS pentru interacțiunile sale substanțiale de stivuire pi-pi cu Phe26, Tyr132 și Tyr138. Această tendință este frecvent observată în screeningul virtual, unde moleculele mari se clasează mai bine ca urmare a interacțiunilor extinse cu receptorul .