Efectele protonării histidinei și ale stărilor rotamerice asupra screening-ului virtual al RmlC din M. tuberculosis

Pentru a evalua efectul protonării histidinei și al stărilor rotamerice asupra performanței predictive a receptorilor, am efectuat un screening virtual (VS) pentru enzima RmlC din Mtb pe baza rezultatelor unui studiu anterior de screening de mare capacitate (HTS). Mai jos, vom examina mai întâi interacțiunile tipice ale ligandului co-cristal TRH pentru a sonda dependența poziției ligandului de protonarea histidinei. În continuare, contextualizăm analiza performanței de îmbogățire și a puterii de predicție a diferitelor modele de receptori, discutând interacțiunile cu receptorul pentru a arăta efectul diferitelor stări de protonare a histidinei asupra VS. În cele din urmă, comparăm valorile pKa previzionate calculate de mai multe pachete comune de calcul pKa cu stările de protonare a receptorului cu cea mai bună putere de predicție.

Docking of TRH

Docking the co-crystal ligand TRH back into 36 receptor models was carried out to show the pose, or ligand orientation relative to the receptor, dependence on histidine protonation and rotameric states. Modelele de legături de hidrogen intuitive din punct de vedere chimic pentru coordonatele cristaline ale His62 și His119, prezentate în Fig. 2b, implică semnificația potențială a legăturilor de hidrogen în andocarea TRH. Docking-ul acestui ligand a permis examinarea preliminară a dependenței poziției de posibilele rețele de legături de hidrogen cu receptorul.

Variația stărilor de protonare a histidinei are un efect clar asupra predicției poziției pentru ligandul determinat pe cocristal. RMSD a pozitiei de andocare a TRH auto-andocat în coordonatele cristaline pentru diferite stări de protonare și rotamerice ale His62 și His119 a variat de la 2,91 la 5,44 Å. Starea de protonare a ambelor histidine cu cea mai bună medie RMSD este HIE, care concordă cu cele mai probabile stări de protonare ale coordonatelor cristaline ale TRH. De asemenea, în toate cazurile, algoritmul de andocare prezice corect poziția pirofosfatului ligandului, dar abaterea mare de la coordonatele cristaline provine în principal din răsturnarea fracțiunilor de timidină și ramnoză în jurul pirofosfatului, ceea ce duce la modele diferite de legături de hidrogen între TRH și cele două histidine. Acest lucru indică importanța rețelelor de legături de hidrogen cu His62 și His119 în predicția poziției ligandului TRH din cocristal. Prin urmare, după ce am examinat dependența posei de legăturile de hidrogen furnizate de două histidine, am extins studiul nostru pentru a examina sistematic clasificarea compușilor în VS și modul în care aceasta este afectată de stările de protonare și rotamerice ale histidinelor.

Screening virtual

Amplasarea moleculară a fost efectuată pentru a examina dependența clasificării compușilor de stările de protonare și rotamerice ale histidinei. Setul de liganzi a inclus zece activi și 2.000 de inactivi selectați la întâmplare dintr-un HTS. Observăm că scorurile Tanimoto indică faptul că majoritatea momelilor noastre au o similitudine scăzută cu substanțele active. Un astfel de set de momeli reprezintă o provocare mai mică pentru algoritmul de andocare, iar performanța predictivă a VS poate fi afectată atunci când se utilizează momeli cu o similitudine mai mare cu substanțele active. Cu toate acestea, acest studiu a urmărit să examineze nu performanța predictivă a algoritmului de andocare în sine, ci modul în care stările de protonare a histidinei afectează performanța relativă în VS.

Liganzii activi andocați și analogul produsului au fost examinați inițial pentru a caracteriza interacțiunile importante din situsul de legare RmlC. În toate modelele de receptori, interacțiunile hidrofobe de stivuire pi-pi contribuie în mod semnificativ la scorul de andocare a compușilor activi în cadrul situsului activ RmlC. Compusul de succes inițial din HTS, SID7975595, se situează la un nivel ridicat în majoritatea modelelor de receptori, între locul 8 și locul 51 în 26 din 36 de receptori. Deși există doar o similitudine structurală limitată între SID7975595 și ligandul cocristal TRH, inelul triciclic al lui SID7975595 înlocuiește cu ușurință fracțiunea de timidină a TRH, în timp ce inelul benzimidazolonic înlocuiește fracțiunea de ramnoză, furnizând baza structurală a inhibiției. După cum se arată în Fig. 3, interacțiunea hidrofobă dintre substanțele active și receptor implică adesea Tyr132 și Tyr138 din lanțul A și Phe26 din lanțul B (a se observa că o parte din lanțul B se intrudează în situsul activ al lanțului A). Prin interacțiunea cu reziduurile esențiale ale situsului de legare și prin împiedicarea accesului moleculelor de apă la Phe26 și Tyr132, substanțele active oferă contacte hidrofobe abundente pentru a obține o afinitate de legare ridicată. După cum s-a discutat în Sivendran și colab. , substituirea grupului etil atașat la azotul de pe inelul triciclic al SID7975595 cu un grup alil (de exemplu, compusul activ 77074) sporește și mai mult afinitatea de legare prin formarea unui sigiliu hidrofob și mai strâns. În comparație, înlocuirea acestei grupări cu o grupare metil mai mică sau cu un atom de hidrogen duce la o afinitate de legare mai mică . În plus față de contactele hidrofobe descrise mai sus, unele dintre substanțele active formează, de asemenea, legături de hidrogen cu Ser51, Arg59 și Arg170. O figură care descrie interacțiunile activilor andocați poate fi găsită în Resursa online 3.

Fig. 3

Interacțiunea preconizată a compusului de succes inițial SID7975595 cu HID62 și HIP119 răsturnate în modelul de receptor 23. În general, substanțele active nu au interacțiuni puternice cu His62 sau His119, însă variația stărilor de protonare a histidinei are un efect profund asupra rezultatelor clasificate. Interacțiuni favorabile sunt observate cu alte reziduuri ale situsului de legare, cum ar fi Tyr132 și Tyr138, așa cum sunt reprezentate aici

Interesant este faptul că, în general, substanțele active nu realizează interacțiuni polare cu His62 și His119. După cum se arată în Fig. 3, oxigenul carbonil și cei doi nitrogeni benzimidazolonici ai SID7975595 sunt orientați în direcția opusă lui His62 și His119. Direcția hidrogenilor aromatici ai activilor este adesea incapabilă să participe la rețelele de legături de hidrogen cu cele două histidine. Cu toate acestea, stările diferite de protonare și rotamerice ale acestor histidine afectează rezultatele VS prin interacțiunile lor cu momelile.

Evaluarea diferențelor de clasificare

Nu este neobișnuit ca doar primul 1 % din compușii examinați să poată fi testați experimental într-un studiu VS, din cauza resurselor limitate. Prin urmare, metrica factorului de îmbogățire (EF)1 %, care reflectă performanța de îmbogățire a bazei de date în primul 1 % (20 de compuși andocați) dintr-o bibliotecă, devine deosebit de relevantă în evaluarea puterii de predicție a VS. EF1% variază de la 0 la 80 pentru 36 de modele de receptori (tabelul 1), ceea ce indică faptul că rezultatele VS sunt sensibile la stările de protonare și rotamerice ale His62 și His119 din RmlC. Cu toate acestea, 28 din 36 de receptori clasifică mai mult de opt active în primele 10 % din VS, așa cum reiese din EF10% (tabelul 1), ceea ce sugerează că majoritatea receptorilor sunt capabili să distingă activii și momelile atunci când se ia în considerare o parte mai mare (10 %) din baza de date. Rezultatele EF sugerează, de asemenea, că modelele de receptori cu HIP62 sau HIP119 tind să aibă performanțe slabe de îmbogățire, probabil din cauza rețelelor extinse de legături de hidrogen cu momelile, după cum se discută mai târziu.

Arie sub curba caracteristică de funcționare a receptorului (AUC) pentru fiecare model de receptor a fost evaluată pentru a raporta performanța de îmbogățire a modelelor la diferite stări de protonare și rotamerice ale His62 și His119. După cum se arată în Fig. 4a și în Tabelul 1, valorile AUC ale tuturor modelelor de receptori variază între 0,868 și 0,996, indicând o performanță predictivă bună în general (o AUC de 0,5 corespunde unei absențe de diferențiere între activi și momeli). În general, rezultatul AUC este complementar cu evaluarea EF pentru performanța predictivă a receptorilor. Rezumând tabelul 1, Fig. 4c arată modul în care intervalul de performanță a receptorului depinde de cele două stări de protonare a histidinei și de rotamerie. Luând în considerare intervalul 25-75 % al AUC-urilor (Fig. 4c, indicat de liniile mai groase), modelele His62 prezintă o variație mai mare între stările His119. Modelele His119, pe de altă parte, au o performanță mai consistentă, indiferent de stările de protonare ale His62, cu excepția stării HIP. Acest lucru indică faptul că diferitele stări de protonare ale His62 au o influență mai mică decât cele ale His119 asupra performanței receptorilor în screening-ul nostru.

Fig. 4

a Valorile AUC ale celor 36 de modele de receptori. Stările de protonare și rotamerice sunt marcate pentru fiecare histidină. Stările de răsturnare sunt marcate cu litera F. Culoarea mai închisă indică o AUC mai mare și o performanță de predicție mai bună a modelului de receptor corespunzător. b Procentul mediu de legături de hidrogen al primilor 1 % dintre compușii de top 1 % din 36 de rulări VS. Stările de protonare și rotamerice sunt marcate pentru fiecare histidină. O culoare mai deschisă indică un procent mai mare de legături de hidrogen, cu unitatea % pentru bara de culori. R2 pentru corelația dintre AUC și procentul mediu de legături de hidrogen pentru fiecare rulare VS este de 0,42 (a se vedea Resursa online 4 pentru diagrama de dispersie). c Dependența performanței receptorului de His62 (sus) și His119 (jos). Mediana valorilor AUC ale fiecărei stări de protonare este indicată cu o linie orizontală mare. Căpușele mici din fiecare model de histidină marchează șase stări de protonare diferite ale celeilalte histidine. Liniile verticale mai groase reprezintă intervalul 25-75 % al valorilor AUC. Cele mai bune modele de receptori sunt prezentate în mod explicit cu stările de protonare ale modelelor

O dependență mai puternică a îmbogățirii de stările de protonare ale His119 este observată în modelele HIE62 și HIP62. Cu starea HIE62, modelele cu HIP119 răsturnat (modelul 6) și HIE119 răsturnat (modelul 2) dau cea mai mare performanță a receptorului. Modelele 3 și 5 cu HID119 și HIP119, respectiv HIP119, conduc la cea mai slabă îmbogățire. Examinând de ce starea HIE62 are cea mai mare variație a AUC-urilor, se constată că His62 are fie stivuire pi-pi, fie nu are interacțiuni cu liganzii și face doar câteva legături de hidrogen cu momeli de rang înalt. Prin urmare, performanța receptorului depinde de interacțiunea lui His119 cu momelile. Acest lucru se observă, de asemenea, atunci când se examinează intervalul larg de performanță al AUC-urilor modelelor HIP62. Rețelele de legături de hidrogen cu momelile vor fi discutate mai târziu, în secțiunea următoare.

Pentru a evalua semnificația statistică a diferenței valorilor AUC între o pereche de modele de receptori, am efectuat un test p cu două fețe la nivelul de 95 % pe ipoteza nulă că perechea are valori AUC comparabile din punct de vedere statistic, față de ipoteza alternativă că diferența dintre valorile AUC și puterea de predicție a acestora este semnificativă din punct de vedere statistic. Rezultatul este prezentat în Tabelul de resurse online 1, valorile p mai mici de 0,05 fiind subliniate. În medie, receptorii au mai mult de 16 valori p mai mici de 0,05, demonstrând sensibilitatea VS la protonarea histidinei și la stările rotamerice. Așa cum era de așteptat, receptorii cu cele mai semnificative diferențe corespund modelelor cu cele mai mari (modelul 6) sau cele mai mici valori AUC (modelele 3, 29 și 5). Modelul 6 este mai bun din punct de vedere statistic la clasificarea substanțelor active față de momeli decât alți 26 de receptori din ansamblu. Modelele 3, 29 și 5 sunt în mod distinct mai slabe la clasificarea substanțelor active decât 29, 25 și, respectiv, 31 de alți receptori.

Analiza cantitativă a interacțiunilor de legătură de hidrogen a fost efectuată pentru primele 1 % (20 de compuși andocați) din fiecare rezultat VS pentru a lua în considerare interacțiunile abundente de legătură de hidrogen cu reziduurile situsului de legare observate adesea cu momelile. Rezultatele indică o corelație inversă între contribuția legăturii de hidrogen și performanța receptorului. Figura 4b prezintă procentajul mediu de legături de hidrogen al fiecărui model de receptor pentru cei mai buni 1 % dintre compușii andocați. Procentul de legături de hidrogen este definit ca fiind porțiunea termenului de legături de hidrogen Glide XP în scorul total de andocare. Comparația dintre Fig. 4a, b relevă relația inversă dintre procentul de legături de hidrogen și AUC cu un R2 de 0,42 (y = -56,18x + 67,95, corelația este reprezentată grafic în Resursa online 4). Relația inversă este observată în mod obișnuit în cazul modelelor cu HIP119, HIP119 răsturnat sau HID62, unde procentul ridicat de legături de hidrogen a dus la o îmbogățire slabă. De exemplu, modelul de receptor 29 cu HIP62 și HIP119, în care ambele histidine care prezintă donatori de legături de hidrogen orientate spre situsul activ, are una dintre cele mai proaste AUC-uri din cauza procentului ridicat de legături de hidrogen în primele rezultate.

În mod evident, potențialul de legături de hidrogen al His119 determină adesea performanța receptorului. De exemplu, modelul cu HID62 și HIP119 a fost un model aberant printre modelele HID62 din Fig. 4c, cu o îmbogățire vizibil scăzută în comparație cu performanța generală bună a celorlalte cinci modele HID62. Modelele HID62 au un AUC median ridicat de 0,989, în ciuda legăturilor frecvente de hidrogen cu momelile din HID62. Acest lucru se datorează faptului că stările His119 realizează puține interacțiuni de legătură de hidrogen cu momelile. Numai cu starea HIP119 modelul HID62 realizează legături de hidrogen cu un număr de momeli, ceea ce duce la o AUC relativ scăzută. Această observație este în concordanță cu dependența mai puternică a performanței receptorului de stările de protonare ale His119, așa cum s-a discutat mai sus. Resursa online 4 descrie distribuția AUC și procentul de legături de hidrogen împreună cu direcția de donator sau acceptor al legăturii de hidrogen de la două histidine aflate în fața receptorului.

Analizele de mai sus evidențiază efectul de împiedicare a legăturilor de hidrogen cu momelile asupra puterii de predicție a VS, datorită coordonatelor variate a două histidine cu stări de protonare și rotamerice diferite. Dispersia corelației observate cu R2 de 0,42 este probabil atribuită mai multor cauze, inclusiv naturii chimice a setului de date ale momelilor, precum și ușoarelor diferențe de geometrie ale fiecărui receptor la minimizarea în timpul preparării inițiale a proteinei. Arătând în mod clar sensibilitatea rezultatelor screening-ului virtual asupra diferitelor stări de protonare și rotamerice ale histidinelor din situsul activ, subliniem faptul că trebuie să se acorde atenție la pregătirea coordonatelor atomice ale unui receptor pentru VS, în special având în vedere proprietățile generale ale liganzilor care fac obiectul screening-ului. Aceasta include luarea în considerare a legăturii de hidrogen cu ligandul cocristal și efectul său asupra preparării proteinei, precum și o analiză cuprinzătoare a rețelelor de legături de hidrogen proximale. Acest lucru se realizează, de obicei, prin examinarea rezultatelor din pachetele software de predicție pKa utilizate pe scară largă și, până în acest moment, am comparat rezultatele din diferite pachete în raport cu rezultatele noastre VS și le discutăm în continuare.

Docking of the decoys

Diferiți factori conduc la diferențe de clasificare între receptori, în special în ceea ce privește momelile. În general, momelile care s-au clasat mai sus decât substanțele active aveau o greutate moleculară mare și aveau un potențial mai mare de a avea legături de hidrogen cu receptorul. În această secțiune, analizăm în continuare modelele de interacțiune frecvente observate între momeli și receptor, concentrându-ne asupra modelelor de receptori cu o îmbogățire slabă.

Miniștrii au tendința de a avea o greutate moleculară mai mare și mai multe structuri inelare decât cei activi (tabelul 2). Acest lucru face ca momelile să se claseze mai bine, datorită interacțiunilor hidrofobe în absența legăturilor de hidrogen cu receptorul. Figura 5a prezintă interacțiunile hidrofobe realizate prin intermediul compusului inactiv mare 16952387 în modelul de receptor 19. Acest compus este adesea clasat în primele cinci locuri în multe rulări VS pentru interacțiunile sale substanțiale de stivuire pi-pi cu Phe26, Tyr132 și Tyr138. Această tendință este frecvent observată în screeningul virtual, unde moleculele mari se clasează mai bine ca urmare a interacțiunilor extinse cu receptorul .

Tabel 2 Compararea greutății moleculare, a numărului de donatori de legături de hidrogen și a numărului de acceptori de legături de hidrogen pentru substanțele active și momeli
Fig. 5

a Interacțiunea compusului inactiv 16952387 cu HID62 și HIE119 răsturnate în modelul de receptor 19. Compusul nu are nicio interacțiune cu niciuna dintre histidine. Interacțiunile de stivuire Pi-pi cu Phe26 din lanțul B, Tyr132 și Tyr138 contribuie la rangul său ridicat, împreună cu legăturile de hidrogen cu Arg23, Arg59, Arg170 și Ser51 (nu se arată). b Interacțiunea compusului inactiv 17388064 cu HIE62 și HID119 în modelul de receptor 3. Ambele histidine furnizează legături de hidrogen cu compusul

Performața de îmbogățire este deosebit de scăzută pentru receptorii care furnizează rețele de legături de hidrogen abundente cu momelile. Interacțiunile prin His62 și His119 nu au fost observate pe scară largă pentru activi și, prin urmare, compușii cu contribuții entalpice mai mari se clasifică în mod eronat mai favorabil. Un exemplu prezentat în Fig. 5b ilustrează interacțiunea compusului inactiv 17388064 în modelul de receptor 3 (AUC 0,868), clasat pe primul loc. În acest receptor, care este cel mai prost la clasificarea compușilor pe baza AUC, compusul 17388064 formează două legături de hidrogen cu două histidine, una între hidrogenul său hidroxil și azotul δ al HIE62 și cealaltă între oxigenul său hidroxil și hidrogenul de pe azotul δ al HID119. Acest compus are cinci donatori de legături de hidrogen și nouă acceptori, un număr mare în comparație cu mediile respective ale celor ale momelilor și activilor (tabelul 2). Prin urmare, cu o contribuție ridicată a legăturii de hidrogen la scorul total de 34,7 ± 6,62 %, se observă frecvent că acest compus momeală formează cel puțin o legătură de hidrogen cu oricare dintre cele două histidine, obținând astfel ranguri ridicate în mai multe rulări VS.

Alte două modele de receptori, modelul 29 cu HIP62 și HIP119 și modelul 5 cu HIE62 și HIP119, prezintă modele de interacțiune cu momelile similare cu modelul 3. Aceste trei modele au cele mai mici valori AUC, cu o medie de 0,870 între ele. După cum s-a discutat mai sus, valorile AUC ale acestora diferă semnificativ față de alți receptori, reflectând relația subtilă dintre legăturile de hidrogen realizate prin His62 și His119 și îmbogățirea slabă. O figură suplimentară care descrie rețelele de legături de hidrogen între momeli și receptori este furnizată în Resursa online 5.

Predicția pKa pentru His62 și His119

Rezultatele noastre demonstrează în mod clar sensibilitatea screening-ului virtual asupra protonării histidinei și a stărilor rotamerice. În multe studii biofizice computaționale, stările de protonare ale reziduurilor titrabile sunt determinate cu ajutorul diferitelor programe de predicție pKa. Pentru a evalua performanța acestor programe de identificare a modelului de receptor cu cea mai bună putere de predicție în docking, am comparat rezultatele predicției pKa ale His62 și His119 din PROPKA, Maestro, H++ și MCCE, așa cum se arată în tabelul 3, cu valorile pKa calculate.

Tabelul 3 Compararea predicțiilor pentru stările de protonare ale His62 și His119 din RmlC realizate de softurile utilizate în mod obișnuit, cu valorile pKa calculate

În primul rând, PROPKA 3.1 prezice că atât His62 cât și His119 sunt neutre indiferent de prezența TRH în timpul preparării. Cu toate acestea, programul nu poate atribui stări rotamerice ale histidinelor. Prin urmare, o stare de HID, HID răsturnată, HIE sau HIE răsturnată trebuie determinată manual. Similar cu PROPKA, programul H++, care utilizează o electrostatică continuă cu structură unică, găsește, de asemenea, ambele histidine ca fiind neutre, deși valorile pKa prezise sunt diferite de cele din PROPKA. Programul MCCE, care se bazează pe electrostatica continuum cu mai multe conformații, prezice că His62 este neutră, în timp ce His119 este protonată.

În continuare, am folosit programul Protein Preparation Wizard din Maestro pentru a calcula pKa ale His62 și His119 cu și fără TRH. Rețineți că Maestro este capabil să varieze stările rotamerice, în timp ce PROPKA nu poate. O actualizare recentă îi permite lui Maestro să utilizeze PROPKA în predicția pKa în locul lui Epik. Cu Epik, Maestro prezice atât His62, cât și His119 în stări dublu protonate, indiferent de prezența TRH. Este interesant faptul că modelul de receptor care corespunde acestei stări de multi-histidină are cea mai slabă putere de predicție, cu o AUC de 0,869. Atunci când se utilizează PROPKA, HIP62 și HIE119 sunt prezise pentru complexul proteină-TRH și HIE62 și HIE119 pentru proteina apo. Aceste două predicții realizate de PROPKA în Maestro corespund modelelor cu o performanță moderată de îmbogățire, cu AUC de 0,971 pentru modelul 25 (HIP62 și HIE119) și, respectiv, 0,942 pentru modelul 1 (HIE62 și HIE119).

Datorită faptului că predicțiile de mai sus realizate de diferite programe software variază în mod semnificativ unele față de altele, trebuie să se manifeste prudență atunci când se utilizează aceste rezultate ca orientare pentru a pregăti o proteină pentru screening-ul virtual. Fără o cunoaștere intimă a adevăratei stări de protonare a receptorului, precum și a liganzilor care sunt supuși screening-ului, este dificil de abordat această problemă. Prin urmare, sugerăm că o analiză la scară mică, precum cea efectuată în acest studiu, și compararea cu datele experimentale, dacă sunt disponibile, ar putea oferi o descriere mai precisă a stărilor de protonare și rotamerice ale reziduurilor titrabile din receptorii proteici pentru viitoarele criblări la scară mai mare. Alternativ, un model care include încorporarea explicită a protonării lanțului lateral alternativ și a stărilor rotamerice în timpul docking-ului, eventual cu informații stocate în grilă, așa cum există pentru hidroxilii și tiolii rotabili în Glide, ar putea merita să fie urmărit. Examinarea rezultatelor în ceea ce privește stările de protonare și clasamentele bazate pe interacțiunile cu histidinele ar trebui să fie examinate cu atenție înainte de a trece la testarea experimentală.

În plus, flexibilitatea receptorului va afecta probabil stările de protonare ale reziduurilor ionizabile. Deși acest lucru nu a fost studiat în mod explicit aici, în afară de minimizarea fiecărui receptor după atribuirea stărilor de protonare, flexibilitatea proteinelor este în mod clar importantă pentru proiectarea și dezvoltarea de medicamente . Luarea în considerare a spațiului conformațional și a spațiului de protonare în conjuncție devine rapid dificil de rezolvat cu metode fizice, cum ar fi cele descrise aici, dar metodele de eșantionare îmbunătățite sunt promițătoare în abordarea acestor dificultăți . Aceasta include simulări de dinamică moleculară cu pH constant, pentru care pH-ul este o variabilă termodinamică externă, utilizată pentru predicția oarbă a valorilor pKa ale reziduurilor titrabile . Aplicarea eficientă a rezultatelor acestor simulări la proiectarea moleculară este un domeniu de interes permanent. Ansamblurile de echilibru provenite din astfel de simulări pot fi utilizate împreună cu docking ca o aplicație a schemei complexe relaxate, în care se efectuează un screening virtual cu un ansamblu de structuri diferit protonate, pentru a îmbunătăți rezultatele îmbogățirii . Luarea în considerare a flexibilității receptorului în pregătirea țintei va conduce la o eșantionare mai largă a spațiului conformațional și de protonare, îmbunătățind astfel performanța VS.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.