Za účelem vyhodnocení vlivu protonace histidinu a rotamerových stavů na prediktivní výkonnost receptorů jsme provedli virtuální screening (VS) enzymu Mtb RmlC na základě výsledků předchozí studie vysoce výkonného screeningu (HTS). Níže nejprve prozkoumáme typické interakce ko-krystalového ligandu TRH, abychom prozkoumali závislost polohy ligandu na protonizaci histidinu. Dále uvedeme do kontextu analýzu obohacovacího výkonu a prediktivní síly různých modelů receptorů tím, že probereme interakce s receptorem, abychom ukázali vliv různých stavů protonace histidinu na VS. Nakonec porovnáváme předpovězené hodnoty pKa vypočtené několika běžnými balíčky pro výpočet pKa se stavy protonace receptoru s nejlepší prediktivní silou.
Docking TRH
Docking ko-krystalového ligandu TRH zpět do 36 modelů receptoru byl proveden s cílem ukázat závislost pózy neboli orientace ligandu vzhledem k receptoru na protonaci histidinu a rotamerových stavech. Chemicky intuitivní vzory vodíkových vazeb pro krystalové souřadnice His62 a His119, uvedené na obr. 2b, naznačují potenciální význam vodíkových vazeb při dokování TRH. Dokování tohoto ligandu umožnilo předběžně prozkoumat závislost pózy na možných sítích vodíkových vazeb s receptorem.
Různé stavy protonace histidinu mají zřetelný vliv na předpověď pózy pro stanovený ko-krystalový ligand. RMSD dokování pózy samodokovaného TRH do krystalových souřadnic pro různé protonační a rotamerové stavy His62 a His119 se pohybovalo od 2,91 do 5,44 Å. Protonační stav obou histidinů s nejlepší průměrnou RMSD je HIE, který souhlasí s nejpravděpodobnějšími protonačními stavy krystalových souřadnic TRH. Ve všech případech také dokovací algoritmus správně předpovídá polohu pyrofosfátu ligandu, ale velká odchylka od krystalových souřadnic vyplývá především z převrácení thymidinových a ramnosových částí kolem pyrofosfátu, což vede k rozdílným vzorcům vodíkových vazeb mezi TRH a dvěma histidiny. To naznačuje důležitost sítí vodíkových vazeb s His62 a His119 při předpovědi polohy ko-krystalového ligandu TRH. Proto jsme po prozkoumání závislosti pózy na vodíkových vazbách poskytovaných dvěma histidiny rozšířili naši studii o systematický pohled na řazení sloučenin ve VS a na to, jak je ovlivněno protonací a rotamerními stavy histidinů.
Virtuální screening
Molekulární dokování bylo provedeno za účelem prozkoumání závislosti řazení sloučenin na protonaci histidinů a rotamerních stavech. Soubor ligandů zahrnoval deset aktivních a 2 000 neaktivních látek náhodně vybraných z HTS. Poznamenáváme, že Tanimotovo skóre naznačuje, že většina našich návnad má nízkou podobnost s aktivy. Takový soubor návnad představuje pro dokovací algoritmus menší výzvu a samotná prediktivní výkonnost VS může být ovlivněna, pokud se použijí návnady s větší podobností s aktivy. Cílem této studie však nebylo zkoumat prediktivní výkonnost dokovacího algoritmu jako takového, ale to, jak stavy protonizace histidinu ovlivňují relativní výkonnost ve VS.
Dokované aktivní ligandy a analog produktu byly nejprve zkoumány za účelem charakterizace důležitých interakcí ve vazebném místě RmlC. Ve všech modelech receptorů přispívají hydrofobní pi-pi stohovací interakce významně k dokovacímu skóre aktivních sloučenin v aktivním místě RmlC. Počáteční hitová sloučenina z HTS, SID7975595, se ve většině receptorových modelů umisťuje vysoko, mezi 8. a 51. místem ve 26 z 36 receptorů. Ačkoli existuje pouze omezená strukturní podobnost mezi SID7975595 a ko-krystalovým ligandem TRH, tricyklický kruh SID7975595 snadno nahrazuje thymidinovou část TRH, zatímco benzimidazolonový kruh nahrazuje rhamnosovou část, což poskytuje strukturní základ inhibice. Jak ukazuje obr. 3, hydrofobní interakce mezi aktivními látkami a receptorem často zahrnuje Tyr132 a Tyr138 z řetězce A a Phe26 z řetězce B (všimněte si, že část řetězce B zasahuje do aktivního místa řetězce A). Díky interakci se základními zbytky vazebného místa a zabránění přístupu molekul vody k Phe26 a Tyr132 poskytují aktivní látky hojné hydrofobní kontakty k dosažení vysoké vazebné afinity. Jak uvádí Sivendran a kol. , substituce ethylové skupiny připojené k dusíku na tricyklickém kruhu SID7975595 allylovou skupinou (např. aktivní sloučenina 77074) dále zvyšuje vazebnou afinitu vytvořením ještě těsnějšího hydrofobního uzávěru. Oproti tomu substituce této skupiny menší methylovou skupinou nebo atomem vodíku vede k nižší vazebné afinitě . Kromě výše popsaných hydrofobních kontaktů tvoří některé aktivní látky také vodíkové vazby se Ser51, Arg59 a Arg170. Obrázek popisující interakce dokovaných aktivních látek naleznete v online zdroji 3.
Zajímavé je, že účinné látky obecně nedosahují polárních interakcí s His62 a His119. Jak je znázorněno na obr. 3, karbonylový kyslík a dva benzimidazolonové nitrogeny SID7975595 směřují od His62 a His119. Směr aromatických vodíků aktivních látek se často nemůže účastnit sítí vodíkových vazeb s oběma histidiny. Nicméně rozdílné protonizační a rotamerové stavy těchto histidinů ovlivňují výsledky VS prostřednictvím jejich interakcí s návnadami.
Ohodnocení rozdílů v pořadí
Není neobvyklé, že kvůli omezeným zdrojům může být ve studii VS experimentálně testováno pouze 1 % nejlépe hodnocených sloučenin. Proto se metrika faktoru obohacení (EF)1 %, která odráží výkonnost obohacení databáze v horním 1 % (20 dokovaných sloučenin) knihovny, stává obzvláště důležitou při posuzování prediktivní síly VS. EF1 % se pohybuje od 0 do 80 pro 36 modelů receptorů (tabulka 1), což naznačuje, že výsledky VS jsou citlivé na protonační a rotamerové stavy His62 a His119 RmlC. Nicméně 28 z 36 receptorů řadí více než osm aktivních látek mezi prvních 10 % ve VS, což se odráží v EF10 % (tabulka 1), což naznačuje, že většina receptorů je schopna rozlišit aktivní látky a návnady, pokud se bere v úvahu větší část (10 %) databáze. Výsledky EF také naznačují, že modely receptorů s HIP62 nebo HIP119 mají tendenci ke špatné obohacovací výkonnosti, pravděpodobně kvůli rozsáhlým sítím vodíkových vazeb s návnadami, jak je uvedeno později.
Plocha pod křivkou operační charakteristiky přijímače (AUC) pro každý model receptoru byla vyhodnocena, aby bylo možné informovat o obohacovací výkonnosti modelů při různých protonizačních a rotamerových stavech His62 a His119. Jak je uvedeno na obr. 4a a v tabulce 1, hodnoty AUC všech receptorových modelů se pohybují v rozmezí od 0,868 do 0,996, což naznačuje celkově dobrou prediktivní výkonnost (AUC 0,5 odpovídá nerozlišování mezi aktivními a návnadami). Obecně lze říci, že výsledek AUC doplňuje hodnocení EF pro prediktivní výkonnost receptorů. Shrnutí tabulky 1, obr. 4c ukazuje, jak rozsah výkonnosti receptoru závisí na dvou protonizačních a rotamerových stavech histidinu. Vezmeme-li v úvahu rozsah 25-75 % AUC (obr. 4c, vyznačený silnějšími čarami), vykazují modely His62 větší rozdíly napříč stavy His119. Modely His119 mají naopak konzistentnější výkonnost bez ohledu na protonační stavy His62, s výjimkou stavu HIP. To naznačuje, že různé protonační stavy His62 mají na výkonnost receptorů v našem screeningu menší vliv než stavy His119.
Silnější závislost obohacení na protonačních stavech His119 je pozorována u modelů HIE62 a HIP62. Se stavem HIE62 poskytují modely s převráceným HIP119 (model 6) a převráceným HIE119 (model 2) nejvyšší výkonnost receptoru. Modely 3 a 5 se stavem HID119 a HIP119 vedou k nejhoršímu obohacení. Při zkoumání, proč má stav HIE62 největší rozdíly v AUC, lze zjistit, že His62 má buď pi-pi stacking, nebo žádné interakce s ligandy, a vytváří pouze několik vodíkových vazeb s vysoce postavenými návnadami. Proto výkonnost receptoru závisí na interakci His119 s decoys. To je také vidět při zkoumání širokého rozsahu výkonnosti AUC modelů HIP62. Sítě vodíkových vazeb s decoys budou diskutovány později v následujícím oddíle.
Pro vyhodnocení statistické významnosti rozdílu hodnot AUC mezi dvojicí modelů receptorů jsme provedli oboustranný p test na hladině 95 % pro nulovou hypotézu, že dvojice má statisticky srovnatelné hodnoty AUC, proti alternativní hypotéze, že jejich rozdíl v hodnotách AUC a prediktivní síle je statisticky významný. Výsledek je uveden v online zdrojové tabulce 1, přičemž byly zdůrazněny hodnoty p menší než 0,05. V průměru mají receptory více než 16 hodnot p menších než 0,05, což dokazuje citlivost VS na histidinovou protonaci a rotamerové stavy. Jak se dalo očekávat, receptory s nejvýznamnějšími rozdíly odpovídají modelům s nejvyššími (model 6) nebo nejnižšími hodnotami AUC (modely 3, 29 a 5). Model 6 je statisticky lepší v řazení aktivních látek oproti návnadám než 26 ostatních receptorů v souboru. Modely 3, 29 a 5 jsou v pořadí aktivních látek rozlišitelně horší než 29, 25 a 31 dalších receptorů.
Kvantitativní analýza interakcí vodíkové vazby byla provedena pro 1 % nejlepších (20 dokovaných sloučenin) každého výsledku VS, aby se zohlednily hojné interakce vodíkové vazby se zbytky vazebného místa, které byly často pozorovány u návnad. Výsledky naznačují inverzní korelaci mezi příspěvkem vodíkových vazeb a výkonností receptoru. Obrázek 4b ukazuje průměrné procento vodíkových vazeb každého modelu receptoru pro 1 % nejlepších dokovaných sloučenin. Procento vodíkové vazby je definováno jako podíl členu vodíkové vazby Glide XP na celkovém skóre dokování. Srovnání obr. 4a, b ukazuje inverzní vztah mezi procentem vodíkových vazeb a AUC s R2 0,42 (y = -56,18x + 67,95, korelace je vynesena v online zdroji 4). Inverzní vztah je běžně pozorován u modelů s HIP119, převráceným HIP119 nebo HID62, kde vysoké procento vodíkových vazeb vedlo ke slabému obohacení. Například model receptoru 29 s HIP62 a HIP119, kde oba histidiny představující donory vodíkových vazeb směřující do aktivního místa, má jednu z nejhorších AUC v důsledku vysokého procenta vodíkových vazeb v top hitech.
Nejspíše potenciál vodíkových vazeb His119 často určuje výkonnost receptoru. Například model s HID62 a HIP119 byl mezi modely HID62 na obr. 4c odlehlý, s nápadně nízkým obohacením ve srovnání s celkově dobrým výkonem ostatních pěti modelů HID62. Modely s HID62 mají vysoký medián AUC 0,989, a to navzdory častým vodíkovým vazbám na decoys z HID62. To je způsobeno tím, že stavy His119 dosahují málo interakcí vodíkové vazby s decoys. Pouze se stavem HIP119 model HID62 vytváří vodíkové vazby s řadou decoys, což má za následek relativně nízkou AUC. Toto pozorování souhlasí se silnější závislostí výkonu receptoru na protonizačních stavech His119, jak je uvedeno výše. Online zdroj 4 popisuje rozložení AUC a procento vodíkových vazeb spolu se směrem donoru nebo akceptoru vodíkové vazby ze dvou histidinů směřujících k receptoru.
Výše uvedené analýzy zdůrazňují brzdící účinek vodíkových vazeb na návnady na prediktivní sílu VS v důsledku různých souřadnic dvou histidinů s různými protonačními a rotamerovými stavy. Rozptyl pozorované korelace s R2 0,42 lze pravděpodobně přičíst několika příčinám, včetně chemické povahy souboru údajů o návnadách, jakož i mírným rozdílům v geometrii jednotlivých receptorů při minimalizaci při počáteční přípravě proteinu. Tím, že jsme jasně ukázali citlivost výsledků virtuálního screeningu na různé protonizační a rotamerové stavy histidinů v aktivním místě, zdůrazňujeme, že při přípravě atomárních souřadnic receptoru pro VS je třeba postupovat opatrně, zejména s ohledem na obecné vlastnosti screeningovaných ligandů. To zahrnuje zohlednění vodíkové vazby ke ko-krystalovému ligandu a jejího vlivu na přípravu proteinu, jakož i komplexní analýzu proximálních sítí vodíkových vazeb. Toho se obvykle dosahuje zkoumáním výsledků z široce používaných softwarových balíků pro předpovídání pKa a k tomuto bodu jsme porovnali výsledky z různých balíků vzhledem k našim výsledkům VS a dále je diskutujeme.
Docking dekubitů
Různé faktory vedou k rozdílům v pořadí napříč receptory, zejména s ohledem na dekubit. Obecně platí, že návnady, které se umístily výše než aktivní látky, měly vysokou molekulovou hmotnost a větší potenciál k vytváření vodíkových vazeb s receptorem. V této části dále analyzujeme časté interakční vzorce pozorované mezi decoys a receptorem se zaměřením na modely receptorů se slabým obohacením.
Decoys mají tendenci mít větší molekulovou hmotnost a více kruhových struktur než actives (tabulka 2). To má za následek, že decoys mají vyšší pořadí díky hydrofobním interakcím při absenci vodíkových vazeb s receptorem. Obrázek 5a ukazuje hydrofobní interakce dosažené prostřednictvím velké neaktivní sloučeniny 16952387 v receptorovém modelu 19. Tato sloučenina se v mnoha bězích VS často umisťuje v první pětce pro své značné pi-pi stohovací interakce s Phe26, Tyr132 a Tyr138. Tento trend je často pozorován při virtuálním screeningu, kdy se větší molekuly umísťují lépe v důsledku rozsáhlých interakcí s receptorem .
Výkon obohacení je zvláště nízký u receptorů poskytujících bohaté sítě vodíkových vazeb k návnadám. Interakce přes His62 a His119 nebyly u aktivních látek ve velké míře pozorovány, a proto se sloučeniny s většími entalpickými příspěvky chybně řadí do příznivějšího pořadí. Příklad uvedený na obr. 5b znázorňuje interakci neaktivní sloučeniny 17388064 v receptorovém modelu 3 (AUC 0,868), která se umístila na prvním místě. V tomto receptoru, který je nejhorší při řazení sloučenin na základě AUC, tvoří sloučenina 17388064 dvě vodíkové vazby se dvěma histidiny, jednu mezi svým hydroxylovým vodíkem a δ-nitrogenem HIE62 a druhou mezi svým hydroxylovým kyslíkem a vodíkem na δ-nitrogenu HID119. Tato sloučenina má pět donorů vodíkové vazby a devět akceptorů, což je velký počet v porovnání s příslušnými průměry donorů vodíkové vazby dekoyů a aktiv (tabulka 2). Proto s vysokým příspěvkem vodíkových vazeb k celkovému skóre 34,7 ± 6,62 % je u této návnadové sloučeniny často pozorováno, že vytváří alespoň jednu vodíkovou vazbu s některým ze dvou histidinů, čímž dosahuje vysokých hodnocení ve vícenásobných VS bězích.
Dva další receptorové modely, model 29 s HIP62 a HIP119 a model 5 s HIE62 a HIP119, vykazují podobné interakční vzorce k návnadám jako model 3. Tyto tři modely mají nejnižší hodnoty AUC, přičemž průměrná hodnota mezi nimi je 0,870. Jak bylo uvedeno výše, jejich hodnoty AUC se výrazně liší od ostatních receptorů, což odráží jemný vztah mezi vodíkovými vazbami dosaženými prostřednictvím His62 a His119 a slabým obohacením. Další obrázek popisující sítě vodíkových vazeb mezi návnadami a receptory je uveden v online zdroji 5.
pKa predikce pro His62 a His119
Naše výsledky jasně ukazují citlivost virtuálního screeningu na histidinové protonace a rotamerové stavy. V mnoha výpočetních biofyzikálních studiích se protonační stavy titrovatelných zbytků určují pomocí různých programů pro predikci pKa. Abychom posoudili výkonnost těchto programů při určování modelu receptoru s nejlepší prediktivní silou při dokování, porovnali jsme výsledky predikce pKa His62 a His119 z programů PROPKA, Maestro, H++ a MCCE, jak je uvedeno v tabulce 3, s vypočtenými hodnotami pKa.
První, PROPKA 3.1 předpovídá, že His62 i His119 jsou neutrální bez ohledu na přítomnost TRH během přípravy. Program však nedokáže přiřadit rotamerové stavy histidinů. Proto musí být stav HID, převrácený HID, HIE nebo převrácený HIE určen ručně. Podobně jako program PROPKA i program H++, který používá elektrostatiku kontinua s jednou strukturou, zjistí, že oba histidiny jsou neutrální, ačkoli předpovězené hodnoty pKa se liší od hodnot z programu PROPKA. Program MCCE, který je založen na multikonformační kontinuální elektrostatice, předpovídá His62 jako neutrální, zatímco His119 jako protonovaný.
Dále jsme použili Průvodce přípravou proteinů v programu Maestro k výpočtu pKa His62 a His119 s TRH a bez TRH. Všimněte si, že program Maestro dokáže měnit rotamerové stavy, zatímco PROPKA to neumí. Nedávná aktualizace umožňuje programu Maestro používat při předpovídání pKa místo programu Epik program PROPKA. S Epikem předpovídá Maestro His62 i His119 ve dvojnásobně protonovaných stavech bez ohledu na přítomnost TRH. Zajímavé je, že model receptoru, který odpovídá tomuto vícehistidinovému stavu, má nejhorší prediktivní sílu s AUC 0,869. Při použití PROPKA jsou HIP62 a HIE119 předpovězeny pro komplex protein-TRH a HIE62 a HIE119 pro apo protein. Tyto dvě předpovědi pomocí softwaru PROPKA v programu Maestro odpovídají modelům se středním výkonem obohacení, s AUC 0,971 pro model 25 (HIP62 a HIE119), resp. 0,942 pro model 1 (HIE62 a HIE119).
Vzhledem k tomu, že výše uvedené předpovědi provedené různými softwary se od sebe výrazně liší, je třeba být opatrný při používání těchto výsledků jako vodítka pro přípravu proteinu pro virtuální screening. Bez důvěrné znalosti skutečného protonizačního stavu receptoru i screeningovaných ligandů je obtížné tento problém řešit. Proto navrhujeme, aby analýza v malém měřítku, jaká byla provedena v této studii, a porovnání s experimentálními údaji, pokud jsou k dispozici, mohly poskytnout přesnější popis protonizačních a rotamerových stavů titrovatelných zbytků v proteinových receptorech pro budoucí screeningy většího rozsahu. Případně by stálo za to vyvinout model, který by zahrnoval explicitní začlenění alternativních protonizačních a rotamerových stavů postranních řetězců během dokování, případně s informacemi uloženými v mřížce, jak je tomu u rotovatelných hydroxylových a thiolových zbytků v Glide. Zkoumání výsledků s ohledem na protonační stavy a pořadí na základě interakcí s histidiny by mělo být pečlivě prozkoumáno předtím, než se přistoupí k experimentálnímu testování.
Navíc flexibilita receptoru pravděpodobně ovlivní protonační stavy ionizovatelných zbytků. Ačkoli to zde nebylo explicitně studováno, kromě minimalizace každého receptoru po přiřazení protonizačních stavů je flexibilita proteinů zjevně důležitá pro návrh a vývoj léčiv . Uvažování konformačního a protonizačního prostoru ve spojení se rychle stává neřešitelným pomocí fyzikálních metod, jako jsou zde popsané, ale metody rozšířeného vzorkování se ukazují jako slibné při řešení těchto obtíží . Patří sem simulace molekulární dynamiky s konstantním pH, pro něž je pH vnější termodynamickou proměnnou, používanou pro slepou předpověď hodnot pKa titrovatelných zbytků . Efektivní použití výsledků těchto simulací pro molekulární design je oblastí trvalého zájmu. Rovnovážné ansámbly z takových simulací lze použít ve spojení s dokováním jako aplikaci uvolněného komplexního schématu, kdy se provádí virtuální screening s ansámblem různě protonovaných struktur, aby se zlepšily výsledky obohacení . Zohlednění flexibility receptoru při přípravě cíle povede k širšímu vzorkování konformačního a protonizačního prostoru, čímž se zvýší výkonnost VS.
.