Om het effect van histidineprotonatie en rotamerische toestanden op de voorspellende werking van receptoren te evalueren, hebben we virtuele screening (VS) uitgevoerd voor het Mtb-enzym RmlC op basis van de resultaten van een eerdere high-throughput screening (HTS)-studie. Hieronder zullen we eerst de typische interacties van het co-kristal ligand TRH onderzoeken om de ligand pose afhankelijkheid van histidine protonatie te onderzoeken. Verder contextualiseren we de analyse van de aanrijkingsprestaties en de voorspellende kracht van verschillende receptormodellen, door de interacties met de receptor te bespreken om het effect van verschillende histidine protonatie toestanden op VS te laten zien. Tenslotte vergelijken we de voorspelde pKa waarden berekend door verschillende gangbare pKa berekeningspakketten met de receptor protonatie toestanden met de beste voorspellende kracht.
Docking van TRH
Docking van het co-kristal ligand TRH terug in 36 receptor modellen werd uitgevoerd om de pose, of ligand oriëntatie ten opzichte van de receptor, afhankelijkheid van histidine protonatie en rotamerische toestanden te laten zien. Chemisch intuïtieve waterstofbrugpatronen voor de kristalcoördinaten van His62 en His119, getoond in Fig. 2b, impliceren het potentiële belang van waterstofbruggen bij het docken van TRH. Het docken van dit ligand maakte een eerste onderzoek mogelijk van de afhankelijkheid van de pose van de mogelijke waterstofbrug netwerken met de receptor.
Histidine protonatie toestanden variëren heeft een duidelijk effect op de pose voorspelling voor het bepaalde co-kristal ligand. De RMSD van de docking pose van het zelf gedockte TRH in de kristalcoördinaten voor verschillende protonatie en rotamerische toestanden van His62 en His119 varieerde van 2.91 tot 5.44 Å. De protonatie toestand van beide histidines met de beste gemiddelde RMSD is HIE, wat overeenkomt met de meest waarschijnlijke protonatie toestanden van de kristalcoördinaten van TRH. Ook voorspelt het docking-algoritme in alle gevallen de positie van het pyrofosfaat van het ligand correct, maar de grote afwijking van de kristalcoördinaten komt voornamelijk door het omklappen van de thymidine- en rhamnose-moleculen rond het pyrofosfaat, wat resulteert in verschillende waterstofbruggenpatronen tussen TRH en twee histidines. Dit geeft het belang aan van waterstofbruggen met His62 en His119 in de posevoorspelling van het co-kristal ligand TRH. Daarom, na onderzoek van de pose-afhankelijkheid van waterstofbruggen door twee histidines, hebben we onze studie uitgebreid om systematisch te kijken naar de rangschikking van verbindingen in VS en hoe deze wordt beïnvloed door de protonatie en rotamerische toestanden van histidines.
Virtuele screening
Moleculaire docking werd uitgevoerd om de rangschikking van verbindingen te onderzoeken afhankelijk van de protonatie en rotomerische toestanden van histidine. De ligandenset omvatte tien actieve stoffen en 2000 inactieve stoffen die willekeurig uit een HTS waren geselecteerd. We merken op dat de Tanimoto-scores aangeven dat de meeste van onze decoys een lage gelijkenis hebben met de actieve stoffen. Een dergelijke decoy-set vormt een kleinere uitdaging voor het docking-algoritme en de voorspellende prestaties van VS zelf kunnen worden beïnvloed wanneer decoys met een grotere overeenkomst met de actieve stoffen worden gebruikt. Het doel van deze studie was echter niet de voorspellende prestaties van het docking-algoritme op zich te onderzoeken, maar hoe de protonatietoestanden van histidine de relatieve prestaties in VS beïnvloeden.
Gedockte actieve liganden en het productanalogon werden eerst onderzocht om belangrijke interacties in de bindingsplaats van RmlC te karakteriseren. In alle receptormodellen dragen hydrofobe pi-pi stacking interacties significant bij aan de docking score van de actieve verbindingen binnen de actieve site van RmlC. De initiële hit-verbinding van HTS, SID7975595, is hoog gerangschikt in de meeste receptormodellen, tussen de 8ste en 51ste plaats in 26 van de 36 receptoren. Hoewel er slechts een beperkte structurele overeenkomst is tussen SID7975595 en het co-kristal ligand TRH, vervangt de tricyclische ring van SID7975595 gemakkelijk het TRH thymidine gedeelte, terwijl de benzimidazolone ring het rhamnose gedeelte vervangt, wat de structurele basis van de inhibitie verschaft. Zoals blijkt uit fig. 3, zijn bij de hydrofobe interactie tussen de actieve stoffen en de receptor vaak Tyr132 en Tyr138 van keten A en Phe26 van keten B betrokken (merk op dat een deel van keten B in het actieve gebied van keten A binnendringt). Door interactie met de essentiële residuen van de bindingsplaats en door te voorkomen dat watermoleculen toegang krijgen tot Phe26 en Tyr132, zorgen de actieve stoffen voor overvloedige hydrofobe contacten om de hoge bindingsaffiniteit te bereiken. Zoals besproken in Sivendran et al. , verhoogt substitutie van de ethylgroep verbonden aan de stikstof op de tricyclische ring van SID7975595 door een allylgroep (bijv. de actieve verbinding 77074) de bindingsaffiniteit verder door de vorming van een nog hechtere hydrofobe afdichting. Ter vergelijking, substitutie van deze groep door een kleinere methylgroep of een waterstofatoom resulteert in een lagere bindingsaffiniteit . Naast de hierboven beschreven hydrofobe contacten vormen sommige van de actieve stoffen ook waterstofbruggen met Ser51, Arg59, en Arg170. Een figuur die de interacties van de gedockte actieve stoffen beschrijft, is te vinden in Online Resource 3.
Interessant is dat de actieve stoffen over het algemeen geen polaire interacties met His62 en His119 tot stand brengen. Zoals in fig. 3 te zien is, zijn de carbonylzuurstof en twee benzimidazolon-nitrogenen van SID7975595 van His62 en His119 afgekeerd. De richting van de aromatische hydrogenen van de actieve stoffen is vaak niet in staat om deel te nemen aan waterstofbruggennetwerken met de twee histidines. Niettemin beïnvloeden verschillende protonatie- en rotamerische toestanden van deze histidines de VS-resultaten via hun interacties met de decoys.
Beoordeling van verschillen in rangschikking
Het is niet ongewoon dat alleen de top 1 % van de gescreende verbindingen experimenteel kan worden getest in een VS-studie, als gevolg van de beperkte middelen. Daarom wordt de verrijkingsfactor (EF)1% metriek, die de database verrijkingsprestaties in de top 1% (20 gedockte verbindingen) van een bibliotheek weergeeft, bijzonder relevant bij de beoordeling van de voorspellende kracht van VS. De EF1% varieert van 0 tot 80 voor 36 receptormodellen (Tabel 1), wat aangeeft dat de VS resultaten gevoelig zijn voor de protonatie en rotamerische toestanden van His62 en His119 van RmlC. Niettemin rangschikken 28 van de 36 receptoren meer dan acht actieve stoffen binnen de top 10 % in de VS, zoals blijkt uit de EF10% (tabel 1), wat suggereert dat de meeste receptoren in staat zijn de actieve stoffen en de lokstoffen van elkaar te onderscheiden wanneer een groter deel (10 %) van de databank in aanmerking wordt genomen. De EF-resultaten suggereren ook dat de receptormodellen met HIP62 of HIP119 de neiging hebben om slechte verrijkingsprestaties te hebben, waarschijnlijk als gevolg van de uitgebreide waterstofbruggennetwerken met de decoys, zoals later besproken.
Het gebied onder de receiver operating characteristic curve (AUC) voor elk receptormodel werd geëvalueerd om de verrijkingsprestaties van modellen bij verschillende protonatie- en rotamerische toestanden van His62 en His119 te rapporteren. Zoals blijkt uit Fig. 4a en Tabel 1, liggen de AUC-waarden van alle receptormodellen tussen 0,868 en 0,996, hetgeen wijst op een algemeen goede voorspellende prestatie (een AUC van 0,5 komt overeen met geen differentiatie tussen de actieven en de lokstoffen). In het algemeen is het AUC-resultaat een aanvulling op de EF-beoordeling voor de voorspellende prestaties van de receptor. Tabel 1 samenvattend toont fig. 4c hoe het bereik van de receptorprestatie afhangt van de twee histidineprotonatie- en rotamerische toestanden. Over het bereik van 25-75 % van de AUC’s (Fig. 4c, aangegeven door de dikkere lijnen), vertonen de His62 modellen een grotere variatie tussen de His119 toestanden. De His119 modellen daarentegen presteren consistenter, ongeacht de protoneringstoestanden van His62, met uitzondering van de HIP-toestand. Dit geeft aan dat verschillende protonatietoestanden van His62 een kleinere invloed hebben dan die van His119 op de receptorprestaties in onze screening.
Een sterkere afhankelijkheid van de verrijking van de protonatietoestanden van His119 wordt waargenomen in de HIE62- en HIP62-modellen. Bij de HIE62-toestand leveren de modellen met omgedraaide HIP119 (model 6) en omgedraaide HIE119 (model 2) de hoogste receptorprestaties op. Modellen 3 en 5 met respectievelijk HID119 en HIP119 leiden tot de slechtste verrijking. Als we nagaan waarom de toestand HIE62 de grootste variatie in AUC’s heeft, zien we dat His62 ofwel pi-pi stacking ofwel geen interacties met liganden heeft, en slechts een paar waterstofbruggen maakt met hooggeplaatste decoys. De werking van de receptor hangt dus af van de interactie van His119 met de decoys. Dit blijkt ook uit het brede prestatiebereik van de AUC’s van de HIP62-modellen. De waterstofbindingsnetwerken met de decoys worden later in het volgende hoofdstuk besproken.
Om de statistische significantie van het verschil in AUC-waarden tussen een paar receptormodellen te evalueren, hebben wij een tweezijdige p-toets op 95 %-niveau uitgevoerd op de nulhypothese dat het paar statistisch vergelijkbare AUC-waarden heeft, tegen de alternatieve hypothese dat hun verschil in AUC-waarden en voorspellend vermogen statistisch betekenisvol is. Het resultaat is weergegeven in Online Resource Tabel 1, waarbij de p-waarden van minder dan 0,05 zijn benadrukt. Gemiddeld hebben de receptoren meer dan 16 p-waarden kleiner dan 0,05, waaruit de gevoeligheid van VS voor histidineprotonatie en rotamerische toestanden blijkt. Zoals men zou verwachten, komen de receptoren met de meest significante verschillen overeen met de modellen met de hoogste (model 6) of laagste AUC-waarden (modellen 3, 29, en 5). Model 6 is statistisch beter in het rangschikken van de actieve stoffen boven de lokstoffen dan 26 andere receptoren in het ensemble. Modellen 3, 29 en 5 zijn duidelijk slechter in het rangschikken van de actieve stoffen dan respectievelijk 29, 25 en 31 andere receptoren.
Kwantitatieve analyse van de waterstofbruginteracties werd uitgevoerd voor de top 1% (20 gedockte verbindingen) van elk VS-resultaat om rekening te houden met de overvloedige waterstofbruginteracties met de bindingsplaatsresiduen die vaak bij de decoys worden waargenomen. De resultaten wijzen op een omgekeerd evenredige correlatie tussen de bijdrage van waterstofbruggen en de prestaties van de receptor. Figuur 4b toont het gemiddelde waterstofbrugpercentage van elk receptormodel voor de top 1% gedockte verbindingen. Het waterstofbrugpercentage is gedefinieerd als het aandeel van de waterstofbrugterm van Glide XP in de totale docking-score. Vergelijking van Fig. 4a, b toont de inverse relatie tussen het waterstofbrugpercentage en AUC met een R2 van 0,42 (y = -56,18x + 67,95, de correlatie is uitgezet in Online Resource 4). De omgekeerde relatie wordt vaak waargenomen bij modellen met HIP119, flipped HIP119 of HID62, waarbij het hoge percentage waterstofbruggen resulteerde in slechte verrijking. Receptormodel 29 met HIP62 en HIP119 bijvoorbeeld, waarbij beide histidines naar de actieve site gerichte waterstofbrugdonoren presenteren, heeft een van de slechtste AUC’s vanwege het hoge percentage waterstofbruggen in de tophits.
Notably, het waterstofbrugpotentieel van His119 bepaalt vaak de receptorprestaties. Zo was het model met HID62 en HIP119 een uitschieter onder de HID62-modellen in Fig. 4c, met een merkbaar lage verrijking vergeleken met de algemeen goede prestaties van de andere vijf HID62-modellen. De HID62-modellen hebben een hoge mediane AUC van 0,989, ondanks de frequente waterstofbinding met de decoys van HID62. Dit is te wijten aan het feit dat de His119-toestanden weinig waterstofbruginteracties met de decoys hebben. Alleen met de HIP119-toestand maakt het HID62-model waterstofbruggen met een aantal decoys, wat tot de relatief lage AUC leidt. Deze waarneming stemt overeen met de sterkere afhankelijkheid van de prestaties van de receptor van de protoneringstoestanden van His119, zoals hierboven besproken. Online Resource 4 beschrijft de AUC verdeling en waterstofbrug percentage samen met de richting van de waterstofbrug donor of acceptor van twee histidines tegenover de receptor.
Bovenstaande analyses benadrukken het belemmerende effect van waterstofbinding aan de decoys op de voorspellende kracht van VS, als gevolg van de verschillende coördinaten van twee histidines met verschillende protonatie en rotamerische toestanden. De spreiding van de waargenomen correlatie met de R2 van 0,42 wordt waarschijnlijk toegeschreven aan verschillende oorzaken, waaronder de chemische aard van de decoy dataset, alsmede de kleine verschillen in geometrie van elke receptor bij minimalisatie in de eerste bereiding van het eiwit. Door duidelijk de gevoeligheid van virtuele screening resultaten op verschillende protonering en rotameric toestanden van histidines in de actieve site, benadrukken we dat zorg moet worden genomen bij de voorbereiding van de atomaire coördinaten van een receptor voor VS, met name gezien de algemene eigenschappen van de liganden worden gescreend. Dit houdt in dat rekening moet worden gehouden met de waterstofbinding aan het co-kristallig ligand en het effect daarvan op de bereiding van het eiwit, alsmede met een uitgebreide analyse van proximale waterstofbindingsnetwerken. Dit wordt gewoonlijk bereikt door de resultaten van veelgebruikte pKa-voorspellende softwarepakketten te onderzoeken, en tot dit punt hebben wij de resultaten van verschillende pakketten vergeleken met onze VS-resultaten en deze verder besproken.
Docking van de decoys
Verschillende factoren leiden tot verschillen in rangschikking tussen de receptoren, met name met betrekking tot de decoys. Over het algemeen hadden de decoys die hoger scoorden dan de actieve stoffen een hoog moleculair gewicht en meer potentieel om waterstofbruggen met de receptor te hebben. In dit deel analyseren we verder de frequente interactiepatronen die tussen de decoys en de receptor zijn waargenomen, met de nadruk op de receptormodellen met een slechte verrijking.
Decoys hebben de neiging een groter molecuulgewicht en meer ringstructuren te hebben dan de actieven (tabel 2). Dit leidt tot een hogere rangschikking van de decoys, als gevolg van hydrofobe interacties bij afwezigheid van waterstofbruggen met de receptor. Figuur 5a toont de hydrofobe interacties die tot stand komen door de grote inactieve verbinding 16952387 in receptormodel 19. Deze verbinding is vaak gerangschikt binnen de top vijf in veel VS runs voor zijn aanzienlijke pi-pi stacking interacties met Phe26, Tyr132, en Tyr138. Deze trend wordt vaak waargenomen in virtuele screening waarbij grotere moleculen beter scoren als gevolg van uitgebreide interacties met de receptor.