Effekter af histidinprotonering og rotameriske tilstande på virtuel screening af M. tuberculosis RmlC

For at evaluere effekten af histidinprotonering og rotameriske tilstande på receptorers prædiktive ydeevne udførte vi virtuel screening (VS) for Mtb-enzymet RmlC baseret på resultaterne af en tidligere high-throughput screening (HTS)-undersøgelse. Nedenfor vil vi først undersøge de typiske interaktioner af co-krystalliganden TRH for at undersøge ligandens poseafhængighed af histidinprotonering. Vi kontekstualiserer yderligere analysen af berigelsespræstationer og forudsigelseskraft af forskellige receptormodeller ved at diskutere interaktionerne med receptoren for at vise effekten af forskellige histidinprotoneringstilstande på VS. Endelig sammenligner vi de forudsagte pKa-værdier beregnet af flere almindelige pKa-beregningspakker med de receptorprotoneringstilstande med den bedste forudsigelseskraft.

Docking af TRH

Docking af co-krystalliganden TRH tilbage i 36 receptormodeller blev udført for at vise posen, eller ligandens orientering i forhold til receptoren, afhængighed af histidinprotonering og rotameriske tilstande. Kemisk intuitive hydrogenbindingsmønstre for krystalkoordinaterne for His62 og His119, vist i fig. 2b, antyder den potentielle betydning af hydrogenbindinger i forbindelse med docking af TRH. Docking af denne ligand gjorde det muligt at foretage en foreløbig undersøgelse af posens afhængighed af de mulige hydrogenbindingsnetværk med receptoren.

Variation af histidinprotoneringstilstande har en klar effekt på poseforudsigelsen for den bestemte samkrystalligand. RMSD af dockingposen af selvdokket TRH i krystalkoordinaterne for forskellige protonerings- og rotameriske tilstande af His62 og His119 varierede fra 2,91 til 5,44 Å. Protoneringstilstanden for begge histidiner med den bedste gennemsnitlige RMSD er HIE, hvilket stemmer overens med de mest sandsynlige protoneringstilstande i krystalkoordinaterne af TRH. I alle tilfælde forudsiger docking-algoritmen også placeringen af ligandens pyrofosfat korrekt, men den store afvigelse fra krystalkoordinaterne skyldes hovedsagelig, at thymidin- og rhamnoseenhederne vender rundt om pyrofosfatet, hvilket resulterer i forskellige hydrogenbindingsmønstre mellem TRH og de to histidiner. Dette indikerer vigtigheden af hydrogenbindingsnetværk med His62 og His119 i forudsigelsen af posen af co-krystalliganden TRH. Efter at have undersøgt poseringsafhængigheden af hydrogenbindinger leveret af to histidiner udvidede vi derfor vores undersøgelse til systematisk at se på rangering af forbindelser i VS, og hvordan den påvirkes af protonering og rotameriske tilstande af histidiner.

Virtuel screening

Molekylær docking blev udført for at undersøge forbindelsernes rangeringsafhængighed af histidinprotonering og rotomeriske tilstande. Ligandesættet omfattede ti aktive stoffer og 2 000 inaktive stoffer, der blev udvalgt tilfældigt fra en HTS. Vi bemærker, at Tanimoto-scorerne viser, at de fleste af vores decoys har en lav lighed med de aktive stoffer. Et sådant sæt af lokkemidler udgør en mindre udfordring for docking-algoritmen, og VS’s forudsigelsespræstation kan blive påvirket, når der anvendes lokkemidler med større lighed med de aktive stoffer. Denne undersøgelse havde imidlertid ikke til formål at undersøge docking-algoritmens prædiktive ydeevne i sig selv, men hvordan histidinprotoneringstilstande påvirker den relative ydeevne i VS.

Dockede aktive ligander og produktanalogen blev i første omgang undersøgt for at karakterisere vigtige interaktioner i RmlC-bindingsstedet. I alle receptormodeller bidrager hydrofobiske pi-pi stacking-interaktioner væsentligt til docking-score for de aktive forbindelser i RmlC’s aktive sted. Den første hitforbindelse fra HTS, SID7975595, er højt rangeret i de fleste receptormodeller, mellem 8. og 51. rang i 26 ud af 36 receptorer. Selv om der kun er begrænset strukturel lighed mellem SID7975595 og co-krystal-liganden TRH, erstatter den tricykliske ring i SID7975595 let TRH’s thymidin-delen, mens benzimidazolonringen erstatter rhamnose-delen, hvilket udgør det strukturelle grundlag for inhiberingen. Som vist i fig. 3 involverer den hydrofobiske interaktion mellem de aktive stoffer og receptoren ofte Tyr132 og Tyr138 fra kæde A og Phe26 fra kæde B (bemærk, at en del af kæde B trænger ind i det aktive sted i kæde A). Ved at interagere med de essentielle bindingsstedsrester og forhindre vandmolekyler i at få adgang til Phe26 og Tyr132 giver de aktive stoffer rigelige hydrofobiske kontakter for at opnå den høje bindingsaffinitet. Som omtalt i Sivendran et al. øger substitution af ethylgruppen, der er knyttet til nitrogenet på den tricykliske ring i SID7975595, med en allylgruppe (f.eks. den aktive forbindelse 77074) yderligere bindingsaffiniteten ved at danne en endnu tættere hydrofob forsegling. Til sammenligning resulterer substitution af denne gruppe med en mindre methylgruppe eller et hydrogenatom i en lavere bindingsaffinitet . Ud over de hydrofobiske kontakter, der er beskrevet ovenfor, danner nogle af de aktive stoffer også hydrogenbindinger med Ser51, Arg59 og Arg170. En figur, der beskriver interaktionerne mellem de dockede aktivstoffer, findes i Online Resource 3.

Figur 3

Forudsagt interaktion mellem det oprindelige hitstof SID7975595 med flippet HID62 og HIP119 i receptormodel 23. Generelt har de aktive stoffer ikke stærke interaktioner med His62 eller His119, men varierende histidinprotoneringstilstande har en dybtgående effekt på de rangordnede resultater. Der observeres gunstige interaktioner med andre bindingsstedsrester, såsom Tyr132 og Tyr138, som afbildet her

Interessant nok opnår de aktive stoffer generelt ikke polære interaktioner med His62 og His119. Som det fremgår af fig. 3, vender carbonylsyren og de to benzimidazolon-nitrogener i SID7975595 væk fra His62 og His119. Retningen af de aromatiske hydrogener i de aktive stoffer er ofte ikke i stand til at deltage i hydrogenbindingsnetværk med de to histidiner. Ikke desto mindre påvirker forskellige protonerings- og rotamertilstande for disse histidiner VS-resultaterne gennem deres interaktioner med decoys.

Vurdering af forskelle i rangordning

Det er ikke ualmindeligt, at kun de øverste 1 % af de screenede forbindelser kan testes eksperimentelt i en VS-undersøgelse på grund af de begrænsede ressourcer. Derfor bliver berigelsesfaktoren (EF)1 %-metrikken, som afspejler databasens berigelsesydelse i de øverste 1 % (20 dokkede forbindelser) af et bibliotek, særlig relevant ved vurderingen af VS’s forudsigelseskraft. EF1% varierer fra 0 til 80 for 36 receptormodeller (tabel 1), hvilket indikerer, at VS-resultaterne er følsomme over for protonering og rotameriske tilstande af His62 og His119 i RmlC. Ikke desto mindre rangerer 28 ud af 36 receptorer mere end otte aktive stoffer inden for de øverste 10 % i VS, som det fremgår af EF10 % (tabel 1), hvilket tyder på, at de fleste receptorer er i stand til at skelne mellem aktive stoffer og lokkeduer, når en større del (10 %) af databasen tages i betragtning. EF-resultaterne tyder også på, at receptormodellerne med HIP62 eller HIP119 har tendens til at have en dårlig berigelsespræstation, sandsynligvis på grund af de omfattende hydrogenbindingsnetværk med decoys, som diskuteret senere.

Arealet under den modtageroperationskarakteristiske kurve (AUC) for hver receptormodel blev evalueret for at rapportere berigelsespræstationen af modellerne ved forskellige protonerings- og rotameriske tilstande af His62 og His119. Som vist i fig. 4a og tabel 1 ligger AUC-værdierne for alle receptormodellerne mellem 0,868 og 0,996, hvilket indikerer en generelt god prædiktiv ydeevne (en AUC på 0,5 svarer til ingen differentiering mellem de aktive stoffer og decoys). Generelt er AUC-resultatet et supplement til EF-vurderingen af receptorernes prædiktive ydeevne. Ved at opsummere tabel 1 viser fig. 4c, hvordan receptorpræstationen afhænger af de to histidinprotonerings- og rotameriske tilstande. Hvis man betragter AUC’ernes 25-75 %-område (fig. 4c, angivet med de tykkere linjer), viser His62-modellerne en større variation på tværs af His119-tilstande. His119-modellerne har på den anden side en mere konsistent præstation uanset His62’s protoneringstilstande, med undtagelse af HIP-tilstanden. Dette indikerer, at forskellige protoneringstilstande for His62 har en mindre indflydelse end His119-tilstandene på receptorydelsen i vores screening.

Figur 4

a AUC-værdier for 36 receptormodeller. Protonerings- og rotameriske tilstande er markeret for hvert histidin. Flippede tilstande er markeret med bogstavet F. Mørkere farve angiver højere AUC og bedre forudsigelsespræstation for den tilsvarende receptormodel. b Gennemsnitlig hydrogenbindingsprocent for de øverste 1 % forbindelser i 36 VS-kørsler. Protonering og rotameriske tilstande er markeret for hvert histidin. Lysere farve angiver højere hydrogenbindingsprocent, med %-enhed for farvebjælken. R2 for korrelationen mellem AUC’erne og den gennemsnitlige hydrogenbindingsprocent for hver VS-kørsel er 0,42 (se Online Resource 4 for spredningsdiagrammet). c Afhængighed af receptorydelse af His62 (øverst) og His119 (nederst). Medianen af AUC-værdierne for hver protoneringstilstand er vist med stor vandret linje. De små kryds i hver histidinmodel markerer seks forskellige protoneringstilstande for det andet histidin. De tykkere lodrette linjer repræsenterer 25-75 % af AUC-værdierne. De bedste receptormodeller er vist eksplicit med modellernes protoneringstilstande

En stærkere afhængighed af berigelsen af protoneringstilstandene for His119 observeres i HIE62- og HIP62-modellerne. Med HIE62-tilstand giver modellerne med flippet HIP119 (model 6) og flippet HIE119 (model 2) den højeste receptorydelse. Model 3 og 5 med henholdsvis HID119 og HIP119 fører til den dårligste berigelse. Når man undersøger, hvorfor HIE62-tilstanden har den største variation i AUC’er, finder man, at His62 enten har pi-pi stacking eller ingen interaktioner med ligander og kun laver nogle få hydrogenbindinger med højt rangerende decoys. Derfor afhænger receptorens ydeevne af His119’s interaktion med decoys. Dette ses også, når man undersøger det brede præstationsområde for AUC’erne for HIP62-modellerne. Hydrogenbindingsnetværkene med decoys vil blive drøftet senere i det følgende afsnit.

For at vurdere den statistiske betydning af forskellen i AUC-værdierne mellem et par receptormodeller udførte vi en tosidet p-test på 95 %-niveau på nulhypotesen om, at parret har statistisk sammenlignelige AUC-værdier, mod den alternative hypotese om, at deres forskel i AUC-værdier og forudsigelseskraft er statistisk betydningsfuld. Resultatet er vist i Online Resource Table 1, hvor p-værdier under 0,05 er fremhævet. I gennemsnit har receptorerne mere end 16 p-værdier mindre end 0,05, hvilket viser VS’ følsomhed over for histidinprotonering og rotameriske tilstande. Som man kunne forvente, svarer receptorerne med de mest signifikante forskelle til de modeller med de højeste (model 6) eller laveste AUC-værdier (model 3, 29 og 5). Model 6 er statistisk set bedre til at rangordne de aktive stoffer frem for decoys end 26 andre receptorer i ensemblet. Modellerne 3, 29 og 5 er markant dårligere til at rangordne de aktive stoffer end henholdsvis 29, 25 og 31 andre receptorer.

Kvantitativ analyse af hydrogenbindingsinteraktionerne blev udført for de øverste 1 % (20 dokkede forbindelser) af hvert VS-resultat for at tage hensyn til de rigelige hydrogenbindingsinteraktioner med bindingsstedets rester, der ofte observeres med decoys. Resultaterne viser en omvendt korrelation mellem hydrogenbindingsbidrag og receptorydelse. Figur 4b viser den gennemsnitlige hydrogenbindingsprocent for hver receptormodel for de bedste 1 % af de docerede forbindelser. Hydrogenbindingsprocenten er defineret som den andel af Glide XP hydrogenbindingstermen i den samlede docking-score. Sammenligning af fig. 4a, b afslører den omvendte sammenhæng mellem hydrogenbindingsprocenten og AUC med en R2 på 0,42 (y = -56,18x + 67,95, korrelationen er plottet i Online Resource 4). Det omvendte forhold er almindeligt observeret med modeller med HIP119, flipped HIP119 eller HID62, hvor den høje hydrogenbindingsprocent resulterede i dårlig berigelse. For eksempel har receptormodel 29 med HIP62 og HIP119, hvor begge histidiner, der præsenterer aktive site-vendte hydrogenbindingsdonorer, en af de dårligste AUC’er på grund af den høje procentdel hydrogenbindinger i de øverste hits.

Notabelt nok bestemmer hydrogenbindingspotentialet af His119 ofte receptorens ydeevne. For eksempel var modellen med HID62 og HIP119 en outlier blandt HID62-modellerne i fig. 4c med en bemærkelsesværdig lav berigelse sammenlignet med den generelt gode præstation af de fem andre HID62-modeller. HID62-modellerne har en høj median AUC på 0,989 på trods af den hyppige hydrogenbinding til decoys fra HID62. Dette skyldes, at His119-tilstande opnår få hydrogenbindingsinteraktioner med decoys. Kun med HIP119-tilstanden laver HID62-modellen hydrogenbindinger med en række af lokomotiverne, hvilket resulterer i den relativt lave AUC. Denne observation stemmer overens med den stærkere afhængighed af receptorens ydeevne af protoneringstilstandene for His119, som beskrevet ovenfor. Online ressource 4 beskriver AUC-fordelingen og hydrogenbindingsprocenten sammen med retningen af hydrogenbindingsdonor eller -acceptor fra to histidiner, der vender mod receptoren.

Overstående analyser fremhæver den hæmmende virkning af hydrogenbinding til decoys på VS’s forudsigelsesevne på grund af de forskellige koordinater af to histidiner med forskellige protonerings- og rotamertilstande. Spredningen af den observerede korrelation med R2 på 0,42 tilskrives sandsynligvis flere årsager, herunder den kemiske karakter af decoy-datasættet, samt de små forskelle i geometrien af hver receptor ved minimering i den indledende forberedelse af proteinet. Ved klart at vise følsomheden af resultaterne af virtuel screening på forskellige protonerings- og rotameriske tilstande af histidiner i det aktive sted, understreger vi, at man bør være forsigtig, når man forbereder de atomare koordinater af en receptor til VS, især i betragtning af de generelle egenskaber af de ligander, der screenes. Dette omfatter hensyntagen til hydrogenbindingen til co-krystal-liganden og dens virkning på proteinpræparationen samt en omfattende analyse af proximale hydrogenbindingsnetværk. Dette opnås normalt ved at undersøge resultaterne fra bredt anvendte pKa-forudsigelses-softwarepakker, og indtil dette punkt har vi sammenlignet resultater fra forskellige pakker i forhold til vores VS-resultater og diskuterer dem yderligere.

Docking af decoys

Flere faktorer fører til forskelle i rangering på tværs af receptorerne, især med hensyn til decoys. Generelt var de lokomotiver, der lå højere end de aktive stoffer, af høj molekylvægt og havde større potentiale til at have hydrogenbindinger med receptoren. I dette afsnit analyserer vi yderligere de hyppige interaktionsmønstre, der er observeret mellem decoys og receptor, med fokus på receptormodellerne med dårlig berigelse.

Decoys har tendens til at have større molekylvægt og flere ringstrukturer end de aktive stoffer (tabel 2). Dette resulterer i, at decoys rangerer højere på grund af hydrofobiske interaktioner i mangel af hydrogenbindinger til receptoren. Figur 5a viser de hydrofobiske interaktioner, der opnås gennem den store inaktive forbindelse 16952387 i receptormodel 19. Denne forbindelse er ofte rangeret blandt de fem bedste i mange VS-kørsler på grund af dens betydelige pi-pi stacking-interaktioner med Phe26, Tyr132 og Tyr138. Denne tendens ses hyppigt i virtuel screening, hvor større molekyler rangerer bedre som følge af omfattende interaktioner med receptoren .

Tabel 2 Sammenligning af molekylvægt, antal hydrogenbindingsdonorer og antal hydrogenbindingsacceptorer for de aktive stoffer og decoys
Figur 5

a Interaktion af den inaktive forbindelse 16952387 med flippet HID62 og HIE119 i receptormodel 19. Forbindelsen har ingen interaktion med nogen af histidinerne. Pi-pi stacking-interaktioner med Phe26 fra kæde B, Tyr132 og Tyr138 bidrager til dens høje rang sammen med hydrogenbindinger med Arg23, Arg59, Arg170 og Ser51 (ikke vist). b Interaktion af den inaktive forbindelse 17388064 med HIE62 og HID119 i receptormodel 3. Begge histidiner giver hydrogenbindinger til forbindelsen

Anberigelsespræstationen er særlig lav for de receptorer, der giver rigelige hydrogenbindingsnetværk til decoys. Interaktioner gennem His62 og His119 blev ikke observeret i stort omfang for de aktive stoffer, og derfor rangerer forbindelser med større enthalpiske bidrag fejlagtigt mere gunstigt. Et eksempel i fig. 5b viser interaktionen mellem den inaktive forbindelse 17388064 i receptormodel 3 (AUC 0,868), der blev rangeret som den første. I denne receptor, som er den dårligste til at rangordne forbindelser baseret på AUC, danner forbindelse 17388064 to hydrogenbindinger med to histidiner, den ene mellem dens hydroxylhydrogen og δ-stivstoffet i HIE62 og den anden mellem dens hydroxylsyre og hydrogenet på δ-stivstoffet i HID119. Denne forbindelse har fem hydrogenbindingsdonorer og ni acceptorer, hvilket er et stort antal sammenlignet med gennemsnittene af de respektive gennemsnit af dem for decoys og aktivstoffer (tabel 2). Med et højt hydrogenbindingsbidrag til den samlede score på 34,7 ± 6,62 % observeres det derfor ofte, at denne decoyforbindelse danner mindst én hydrogenbinding med en af de to histidiner og derved opnår høje placeringer i flere VS-kørsler.

To andre receptormodeller, model 29 med HIP62 og HIP119 og model 5 med HIE62 og HIP119, viser lignende interaktionsmønstre med decoys som model 3. Disse tre modeller har de laveste AUC-værdier, med et gennemsnit på 0,870 blandt dem. Som omtalt ovenfor adskiller deres AUC-værdier sig væsentligt fra andre receptorer, hvilket afspejler det subtile forhold mellem hydrogenbindinger opnået gennem His62 og His119 og dårlig berigelse. En yderligere figur, der beskriver hydrogenbindingsnetværkene mellem decoys og receptorer, findes i Online Resource 5.

pKa-forudsigelse for His62 og His119

Vores resultater viser tydeligt følsomheden af virtuel screening på histidinprotonering og rotameriske tilstande. I mange beregningsmæssige biofysiske undersøgelser bestemmes protoneringstilstandene for de titrerbare rester ved hjælp af forskellige pKa-forudsigelsesprogrammer. For at vurdere disse programmers ydeevne med hensyn til at identificere receptormodellen med den bedste forudsigelseskraft i docking sammenlignede vi pKa-forudsigelsesresultaterne for His62 og His119 fra PROPKA, Maestro, H++ og MCCE, som vist i tabel 3, med de beregnede pKa-værdier.

Tabel 3 Sammenligning af forudsigelserne for protoneringstilstande for His62 og His119 i RmlC foretaget af almindeligt anvendt software, med beregnede pKa-værdier

Først forudsiger PROPKA 3.1, at både His62 og His119 er neutrale uanset tilstedeværelsen af TRH under præparationen. Programmet kan imidlertid ikke tildele rotameriske tilstande for histidiner. Derfor skal en tilstand af HID, flipped HID, HIE eller flipped HIE bestemmes manuelt. I lighed med PROPKA finder programmet H++, som anvender en enkeltstrukturkontinuumelektrostatik, også begge histidiner som neutrale, selv om de forudsagte pKa-værdier er forskellige fra dem fra PROPKA. Programmet MCCE, som er baseret på multikonformationskontinuumelektrostatik, forudsiger His62 til at være neutral, mens His119 er protoneret.

Næst brugte vi Protein Preparation Wizard i Maestro til at beregne pKa for His62 og His119 med og uden TRH. Bemærk, at Maestro er i stand til at variere rotameriske tilstande, mens PROPKA ikke kan det. En nylig opdatering gør det muligt for Maestro at anvende PROPKA i sin pKa-forudsigelse i stedet for Epik. Med Epik forudsiger Maestro både His62 og His119 i dobbelt protonerede tilstande, uanset tilstedeværelsen af TRH. Interessant nok har den receptormodel, der svarer til denne multihistidintilstand, den dårligste forudsigelseskraft med en AUC på 0,869. Når PROPKA anvendes, forudsiges HIP62 og HIE119 for protein-TRH-komplekset og HIE62 og HIE119 for apo-proteinet. Disse to forudsigelser ved PROPKA i Maestro svarer til modellerne med moderat berigelsesydelse med AUC’er på henholdsvis 0,971 for model 25 (HIP62 og HIE119) og 0,942 for model 1 (HIE62 og HIE119).

Da ovenstående forudsigelser foretaget af forskellige programmer varierer betydeligt fra hinanden, bør man være forsigtig, når man bruger disse resultater som en retningslinje til at forberede et protein til virtuel screening. Uden et indgående kendskab til receptorens sande protoneringstilstand samt de ligander, der screenes, er det vanskeligt at løse dette problem. Derfor foreslår vi, at en analyse i lille skala, som den, der er udført i denne undersøgelse, og sammenligning med eksperimentelle data, hvis de er tilgængelige, kunne give en mere præcis beskrivelse af protonerings- og rotamertilstande for de titrerbare rester i proteinreceptorer med henblik på fremtidige screeninger i større skala. Alternativt kan en model, der omfatter eksplicit inkorporering af alternative protonerings- og rotationstilstande i sidekæden under docking, potentielt med information gemt i gitteret, som det findes for roterbare hydroxyls og thioler i Glide, være værd at forfølge. Undersøgelse af resultaterne med hensyn til protoneringstilstande og rangordninger baseret på interaktioner med histidiner bør undersøges nøje, inden man går videre til eksperimentel afprøvning.

Dertil kommer, at receptorfleksibiliteten sandsynligvis vil påvirke protoneringstilstandene for de ioniserbare rester. Selv om dette ikke blev eksplicit undersøgt her, bortset fra minimering af hver receptor efter tildeling af protoneringstilstande, er proteinfleksibilitet klart vigtig for lægemiddeldesign og -udvikling . Overvejelse af konformations- og protoneringsrum i forbindelse bliver hurtigt uoverskueligt med fysiske metoder som dem, der er beskrevet her, men forbedrede prøveudtagningsmetoder viser løfte om at tackle sådanne vanskeligheder . Dette omfatter molekylær dynamiksimuleringer med konstant pH, hvor pH er en ekstern termodynamisk variabel, der anvendes til blind forudsigelse af pKa-værdierne for de titrerbare rester . Effektiv anvendelse af resultaterne fra disse simuleringer til molekylær design er et område, der fortsat er af interesse. Ligevægtsensembler fra sådanne simuleringer kan anvendes sammen med docking som en anvendelse af et afslappet komplekst skema, hvor der foretages virtuel screening med et ensemble af forskelligt protonerede strukturer for at forbedre berigelsesresultaterne . Hvis der tages hensyn til receptorfleksibilitet i målpræparationen, vil det føre til en bredere prøveudtagning af konformations- og protoneringsrummet og dermed forbedre VS’s ydeevne.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.