Effekter av histidinprotonering och rotameriska tillstånd på virtuell screening av M. tuberculosis RmlC

För att utvärdera effekten av histidinprotonering och rotameriska tillstånd på receptorernas prediktiva prestanda utförde vi virtuell screening (VS) för Mtb-enzymet RmlC baserat på resultaten från en tidigare HTS-studie (high-throughput screening). Nedan undersöker vi först de typiska interaktionerna hos samkristalliganden TRH för att undersöka ligandens poseringsberoende av histidinprotonering. Vi kontextualiserar vidare analysen av anrikningsprestanda och prediktionsförmåga hos olika receptormodeller genom att diskutera interaktionerna med receptorn för att visa effekten av olika histidinprotoneringstillstånd på VS. Slutligen jämför vi de predikterade pKa-värdena som beräknats av flera vanliga pKa-beräkningspaket med de receptorprotoneringstillstånd som har den bästa prediktionskraften.

Docking av TRH

Docking av samkristallliganden TRH tillbaka till 36 receptormodeller genomfördes för att visa posen, eller ligandens orientering i förhållande till receptorn, beroendet av histidinprotonering och rotameriska tillstånd. Kemiskt intuitiva vätebindningsmönster för kristallkoordinaterna för His62 och His119, som visas i fig. 2b, antyder den potentiella betydelsen av vätebindningar vid dockning av TRH. Dockning av denna ligand gjorde det möjligt att preliminärt undersöka poseringens beroende av de möjliga vätebindningsnätverken med receptorn.

Varierande histidinprotoneringstillstånd har en tydlig effekt på poseringsprediktionen för den bestämda samkristalligaanden. RMSD för dockningspose av självdockad TRH i kristallkoordinaterna för olika protonerings- och rotamertillstånd för His62 och His119 varierade från 2,91 till 5,44 Å. Protoneringstillståndet för båda histidinerna med bästa genomsnittliga RMSD är HIE, vilket stämmer överens med de mest sannolika protoneringstillstånden i kristallkoordinaterna för TRH. I alla fall förutspår dock dockningsalgoritmen korrekt positionen för ligandens pyrofosfat, men den stora avvikelsen från kristallkoordinaterna beror huvudsakligen på att tymidin- och rhamnosegrupperna vänds runt pyrofosfatet, vilket resulterar i olika vätebindningsmönster mellan TRH och de två histidinerna. Detta visar på betydelsen av vätebindningsnätverken med His62 och His119 i prediktionen av positionen för den samkristallina liganden TRH. Efter att ha undersökt poseberoendet på vätebindningar som tillhandahålls av två histidiner utvidgade vi därför vår studie till att systematiskt titta på rangordning av föreningar i VS och hur det påverkas av protonering och rotermers tillstånd hos histidiner.

Virtuell screening

Molekylär dockning utfördes för att undersöka föreningens rangordningsberoende av histidinernas protonering och rotermers tillstånd. Liganduppsättningen omfattade tio aktiva och 2 000 inaktiva som valdes slumpmässigt från en HTS. Vi noterar att Tanimoto-poängen visar att de flesta av våra lockämnen har en låg likhet med de aktiva ämnena. En sådan uppsättning lockämnen utgör en mindre utmaning för dockningsalgoritmen, och VS:s prediktiva prestanda kan påverkas när lockämnen med större likhet med de aktiva ämnena används. Denna studie syftade dock inte till att undersöka den prediktiva prestandan hos dockningsalgoritmen i sig, utan hur histidinprotoneringstillstånd påverkar den relativa prestandan i VS.

Dockade aktiva ligander och produktanalogen undersöktes inledningsvis för att karaktärisera viktiga interaktioner i RmlC-bindningsstället. I alla receptormodeller bidrar hydrofoba pi-pi staplingsinteraktioner väsentligt till dockningsresultatet för de aktiva föreningarna inom RmlC:s aktiva plats. Den första träffsubstansen från HTS, SID7975595, rankas högt i de flesta receptormodeller, mellan åttonde och 51:a plats i 26 av 36 receptorer. Även om det endast finns en begränsad strukturell likhet mellan SID7975595 och den samkristallina liganden TRH, ersätter den tricykliska ringen i SID7975595 lätt TRH:s tymidinparti, medan bensimidazolonringen ersätter rhamnosegruppen, vilket utgör den strukturella grunden för inhiberingen. Som framgår av figur 3 involverar den hydrofoba interaktionen mellan de aktiva ämnena och receptorn ofta Tyr132 och Tyr138 från kedja A och Phe26 från kedja B (observera att en del av kedja B tränger in i den aktiva platsen för kedja A). Genom att interagera med de viktiga resterna på bindningsstället och hindra vattenmolekyler från att komma åt Phe26 och Tyr132 ger de aktiva substanserna rikligt med hydrofoba kontakter för att uppnå hög bindningsaffinitet. Såsom diskuteras i Sivendran et al. ökar substitutionen av den etylgrupp som är knuten till kvävet på den tricykliska ringen i SID7975595 med en allylgrupp (t.ex. den aktiva föreningen 77074) ytterligare bindningsaffiniteten genom att den bildar en ännu tätare hydrofob förslutning. I jämförelse leder substitution av denna grupp med en mindre metylgrupp eller en väteatom till en lägre bindningsaffinitet. Förutom de hydrofoba kontakterna som beskrivs ovan bildar vissa av de aktiva ämnena också vätebindningar med Ser51, Arg59 och Arg170. En figur som beskriver interaktionerna mellan de dockade aktiva substanserna finns i Online Resource 3.

Figur 3

Förutsedd interaktion mellan den första träffsubstansen SID7975595 och flippade HID62 och HIP119 i receptormodell 23. Generellt sett har de aktiva ämnena inga starka interaktioner med His62 eller His119, men varierande histidinprotoneringstillstånd har en djupgående effekt på de rangordnade resultaten. Gynnsamma interaktioner observeras med andra bindningsplatsrester, såsom Tyr132 och Tyr138 som avbildas här

Interessant nog uppnår de aktiva ämnena generellt sett inte polära interaktioner med His62 och His119. Som framgår av figur 3 är karbonylsyre och två bensimidazolonnitrogener i SID7975595 vända bort från His62 och His119. Riktningen på de aromatiska vätevägarna hos de aktiva ämnena kan ofta inte delta i vätebindningsnätverk med de två histidinerna. Icke desto mindre påverkar olika protonerings- och rotamertillstånd hos dessa histidiner VS-resultaten genom deras interaktioner med lockämnena.

Bedömning av skillnader i rangordning

Det är inte ovanligt att endast den översta 1 % av de screenade föreningarna kan testas experimentellt i en VS-studie, på grund av de begränsade resurserna. Därför blir måttet för anrikningsfaktorn (EF)1 %, som återspeglar databasens anrikningsprestanda i de översta 1 % (20 dockade föreningar) av ett bibliotek, särskilt relevant vid bedömningen av VS:s prediktiva kraft. EF1% varierar från 0 till 80 för 36 receptormodeller (tabell 1), vilket tyder på att VS-resultaten är känsliga för protonerings- och rotamertillstånd för His62 och His119 i RmlC. Trots detta rankar 28 av 36 receptorer mer än åtta aktiva substanser bland de 10 % bästa i VS, vilket återspeglas av EF10 % (tabell 1), vilket tyder på att de flesta receptorer kan skilja mellan aktiva substanser och lockbete när en större del (10 %) av databasen beaktas. EF-resultaten tyder också på att receptormodellerna med HIP62 eller HIP119 tenderar att ha dålig anrikningsprestanda, sannolikt på grund av de omfattande vätebindningsnätverken med decoys, vilket diskuteras senare.

Avsnittet under den karakteristiska mottagarkurvan (AUC) för varje receptormodell utvärderades för att rapportera anrikningsprestanda för modellerna vid olika protonerings- och rotermerstillstånd av His62 och His119. Som framgår av figur 4a och tabell 1 varierar AUC-värdena för alla receptormodeller mellan 0,868 och 0,996, vilket tyder på en överlag god prediktiv förmåga (en AUC på 0,5 motsvarar ingen differentiering mellan aktiva och avledande ämnen). I allmänhet kompletterar AUC-resultatet EF-bedömningen av receptorernas prediktiva prestanda. I sammanfattning av tabell 1 visar figur 4c hur intervallet för receptorns prestanda beror på de två histidinprotonerings- och rotermerstillstånden. Om man tar hänsyn till AUC:s intervall på 25-75 % (fig. 4c, indikerat av de tjockare linjerna) visar His62-modellerna en större variation mellan His119-tillstånden. His119-modellerna har å andra sidan en mer konsekvent prestanda oavsett His62:s protoneringstillstånd, med undantag för HIP-tillståndet. Detta tyder på att His62:s olika protoneringstillstånd har en mindre påverkan än His119:s på receptorns prestanda i vår screening.

Fig. 4

a AUC-värden för 36 receptormodeller. Protonerings- och rotamertillstånd är markerade för varje histidin. Flippade tillstånd markeras med bokstaven F. Mörkare färg indikerar högre AUC och bättre prediktiv prestanda för motsvarande receptormodell. b Genomsnittlig vätebindningsprocent för de 1 % bästa föreningarna i 36 VS-körningar. Protonerings- och rotamertillstånd är markerade för varje histidin. Ljusare färg indikerar högre vätebindningsprocent, med %-enhet för färgbalken. R2 för korrelationen mellan AUC och genomsnittlig vätebindningsprocent för varje VS-körning är 0,42 (se online-resurs 4 för spridningsdiagrammet). c Receptorprestandaberoende av His62 (överst) och His119 (nederst). Medianen av AUC-värdena för varje protoneringstillstånd visas med stor horisontell linje. De små kryssen i varje histidinmodell markerar sex olika protoneringstillstånd för det andra histidinet. De tjockare vertikala linjerna representerar 25-75 % av AUC-värdena. De bästa receptormodellerna visas uttryckligen med modellernas protoneringstillstånd

Ett starkare beroende av anrikningen på protoneringstillstånden för His119 observeras i modellerna HIE62 och HIP62. Med HIE62-tillstånd ger modellerna med flippad HIP119 (modell 6) och flippad HIE119 (modell 2) den högsta receptorprestandan. Modellerna 3 och 5 med HID119 respektive HIP119 leder till den sämsta anrikningen. När man undersöker varför HIE62-tillståndet har den största variationen i AUC finner man att His62 antingen har pi-pi-stapling eller inga interaktioner med ligander, och endast gör ett fåtal vätebindningar med högt rankade avkokare. Därför är receptorns prestanda beroende av His119:s interaktion med decoys. Detta syns också när man undersöker det breda prestandavärdet för AUC:erna för HIP62-modellerna. Vätgasbindningsnätverken med avkokarna kommer att diskuteras senare i följande avsnitt.

För att utvärdera den statistiska betydelsen av skillnaden mellan AUC-värdena mellan ett par receptormodeller utförde vi ett tvåsidigt p-test på 95 %-nivån på nollhypotesen att paret har statistiskt jämförbara AUC-värden, mot den alternativa hypotesen att skillnaden mellan AUC-värdena och den prediktiva förmågan är statistiskt betydelsefull. Resultatet visas i Online Resource Table 1, där p-värden under 0,05 betonas. I genomsnitt har receptorerna mer än 16 p-värden som är mindre än 0,05, vilket visar VS:s känslighet för histidinprotonering och rotameriska tillstånd. Som man kan förvänta sig motsvarar receptorerna med de mest signifikanta skillnaderna modellerna med de högsta (modell 6) eller lägsta AUC-värdena (modellerna 3, 29 och 5). Modell 6 är statistiskt sett bättre på att rangordna aktiva ämnen framför lockbete än 26 andra receptorer i ensemblen. Modellerna 3, 29 och 5 är distinkt sett sämre på att rangordna de aktiva substanserna än 29, 25 respektive 31 andra receptorer.

Kvantitativ analys av vätebindningsinteraktionerna utfördes för de översta 1 % (20 dockade föreningar) av varje VS-resultat för att redogöra för de rikliga vätebindningsinteraktionerna med bindningsställets restsubstanser som ofta observeras med decoys. Resultaten visar på en omvänd korrelation mellan vätebindningsbidraget och receptorns prestanda. Figur 4b visar den genomsnittliga vätebindningsprocenten för varje receptormodell för de 1 % bästa dockade föreningarna. Procentandelen vätebindningar definieras som den del av Glide XP:s vätebindningsterm som utgörs av den totala dockingpoängen. En jämförelse av figurerna 4a och b visar att det finns ett omvänt förhållande mellan vätebindningsprocenten och AUC med en R2 på 0,42 (y = -56,18x + 67,95, korrelationen visas i Online Resource 4). Det omvända förhållandet observeras ofta med modeller med HIP119, flippad HIP119 eller HID62, där den höga vätebindningsprocenten resulterade i dålig anrikning. Till exempel har receptormodell 29 med HIP62 och HIP119, där båda histidinerna som presenterar aktiv plats som vetter mot vätebindningsdonatorer, en av de sämsta AUC:erna på grund av den höga procentandelen vätebindningar i de bästa träffarna.

Noterbart är att vätebindningspotentialen hos His119 ofta avgör receptorns prestanda. Exempelvis var modellen med HID62 och HIP119 en outlier bland HID62-modellerna i figur 4c, med märkbart låg anrikning jämfört med den allmänt goda prestandan hos de andra fem HID62-modellerna. HID62-modellerna har en hög median AUC på 0,989, trots den frekventa vätebindningen till decoys från HID62. Detta beror på att His119-tillstånden uppnår få vätebindningsinteraktioner med decoys. Det är endast med HIP119-tillståndet som HID62-modellen gör vätebindningar med ett antal avkokare, vilket resulterar i den relativt låga AUC. Denna observation stämmer överens med det starkare beroendet av receptorns prestanda på protoneringstillstånden för His119, som diskuterats ovan. I online-resurs 4 beskrivs AUC-fördelningen och vätebindningsprocenten tillsammans med riktningen av vätebindningsdonatorn eller -acceptorn från två histidiner som vetter mot receptorn.

Ovanstående analyser belyser den hindrande effekten av vätebindning till lockbete på VS:s prediktiva förmåga, på grund av de olika koordinaterna för två histidiner med olika protonerings- och rotermerstillstånd. Spridningen av den observerade korrelationen med R2 på 0,42 tillskrivs troligen flera orsaker, inklusive den kemiska karaktären hos decoy-dataset, samt de små skillnaderna i geometri för varje receptor vid minimering i den initiala framställningen av proteinet. Genom att tydligt visa känsligheten hos resultaten av virtuell screening på olika protonerings- och rotamertillstånd hos histidiner i den aktiva platsen betonar vi att man bör vara försiktig när man förbereder atomkoordinaterna för en receptor för VS, särskilt med tanke på de allmänna egenskaperna hos de ligander som ska screenas. Detta innefattar att ta hänsyn till vätebindningen till samkristalliganden och dess effekt på proteinberedningen, samt en omfattande analys av proximala vätebindningsnätverk. Detta uppnås vanligen genom att undersöka resultaten från allmänt använda pKa-prediktionsprogrampaket, och till denna punkt har vi jämfört resultat från olika paket i förhållande till våra VS-resultat och diskuterar dem vidare.

Dockning av lockämnen

Flera faktorer leder till skillnader i rangordning mellan receptorerna, särskilt med avseende på lockämnena. Generellt sett hade de lockämnen som rankades högre än de aktiva ämnena en hög molekylvikt och hade större potential att ha vätebindningar med receptorn. I det här avsnittet analyserar vi ytterligare de frekventa interaktionsmönster som observerats mellan avkokare och receptor, med fokus på receptormodeller med dålig anrikning.

Avkokare tenderar att ha större molekylvikt och fler ringstrukturer än de aktiva (tabell 2). Detta resulterar i att decoys rankas högre på grund av hydrofoba interaktioner i avsaknad av vätebindningar till receptorn. Figur 5a visar de hydrofoba interaktioner som uppnåtts genom den stora inaktiva föreningen 16952387 i receptormodell 19. Denna förening rankas ofta bland de fem bästa i många VS-körningar på grund av dess betydande pi-pi staplingsinteraktioner med Phe26, Tyr132 och Tyr138. Denna trend observeras ofta vid virtuell screening där större molekyler rankas bättre på grund av omfattande interaktioner med receptorn.

Tabell 2 Jämförelse av molekylvikt, antal givare av vätebindningar och antal acceptörer av vätebindningar för de aktiva substanserna och decoys
Figur 5

a Växelverkan mellan den inaktiva substansen 16952387 och flippade HID62 och HIE119 i receptormodell 19. Föreningen har ingen interaktion med någon av histidinerna. Pi-pi staplingsinteraktioner med Phe26 från kedja B, Tyr132 och Tyr138 bidrar till dess höga rang, tillsammans med vätebindningar med Arg23, Arg59, Arg170 och Ser51 (visas inte). b Interaktion mellan den inaktiva föreningen 17388064 och HIE62 och HID119 i receptormodell 3. Båda histidinerna ger vätebindningar till föreningen

Anrikningsprestanda är särskilt låg för de receptorer som ger rikligt med vätebindningsnätverk till lockämnena. Interaktioner genom His62 och His119 observerades inte i stor utsträckning för de aktiva, och därför rankas föreningar med större enthalpiska bidrag felaktigt mer gynnsamt. Ett exempel i figur 5b visar interaktionen mellan den inaktiva föreningen 17388064 i receptormodell 3 (AUC 0,868), som rankas först. I denna receptor, som är sämst på att rangordna föreningar baserat på AUC, bildar förening 17388064 två vätebindningar med två histidiner, en mellan dess hydroxylväte och δ-stickämnet i HIE62 och den andra mellan dess hydroxylsyre och väte på δ-stickämnet i HID119. Denna förening har fem vätebindningsdonatorer och nio acceptorer, vilket är ett stort antal jämfört med genomsnittet för de respektive medelvärdena för decoys och aktiva ämnena (tabell 2). Med ett högt vätebindningsbidrag till den totala poängen på 34,7 ± 6,62 % observeras därför ofta att denna lockbeteförening bildar minst en vätebindning med någon av de två histidinerna och uppnår därmed höga placeringar i flera VS-körningar.

Två andra receptormodeller, modell 29 med HIP62 och HIP119 och modell 5 med HIE62 och HIP119, uppvisar liknande interaktionsmönster till lockbeteföreningar som modell 3. Dessa tre modeller har de lägsta AUC-värdena, med ett genomsnitt på 0,870 bland dem. Som diskuterats ovan skiljer sig deras AUC-värden avsevärt från andra receptorer, vilket återspeglar det subtila förhållandet mellan vätebindningar som uppnås genom His62 och His119 och dålig anrikning. En ytterligare figur som beskriver vätebindningsnätverken mellan decoys och receptorer finns i Online Resource 5.

pKa-förutsägelse för His62 och His119

Våra resultat visar tydligt känsligheten hos virtuell screening på histidinprotonering och rotameriska tillstånd. I många beräkningsbaserade biofysiska studier bestäms protoneringstillstånden för de titrerbara resterna med hjälp av olika pKa-förutsägelseprogram. För att bedöma dessa programs prestanda när det gäller att identifiera receptormodellen med bästa förutsägelseförmåga vid dockning jämförde vi pKa-förutsägelseresultaten för His62 och His119 från PROPKA, Maestro, H++ och MCCE, som visas i tabell 3, med de beräknade pKa-värdena.

Tabell 3 Jämförelse av förutsägelserna för protoneringstillstånd för His62 och His119 i RmlC gjorda av vanliga programvaror, med beräknade pKa-värden

För det första förutsäger PROPKA 3.1 att både His62 och His119 är neutrala oberoende av närvaron av TRH under prepareringen. Programmet kan dock inte tilldela rotamera tillstånd för histidiner. Därför måste tillståndet HID, flipped HID, HIE eller flipped HIE bestämmas manuellt. I likhet med PROPKA finner programmet H++, som använder en kontinuumelektrostatik med en enda struktur, också att båda histidinerna är neutrala, även om de förutspådda pKa-värdena skiljer sig från dem från PROPKA. Programmet MCCE, som bygger på kontinuumelektrostatik med flera konformationer, förutsäger att His62 är neutral medan His119 är protonerad.

Nästan använde vi Protein Preparation Wizard i Maestro för att beräkna pKa för His62 och His119 med och utan TRH. Observera att Maestro kan variera rotameriska tillstånd, medan PROPKA inte kan göra det. En nyligen genomförd uppdatering gör det möjligt för Maestro att använda PROPKA i sin pKa-förutsägelse i stället för Epik. Med Epik förutsäger Maestro både His62 och His119 i dubbelt protonerade tillstånd, oavsett närvaron av TRH. Intressant nog har den receptormodell som motsvarar detta multihistidintillstånd den sämsta prediktionsförmågan med en AUC på 0,869. När PROPKA används förutsägs HIP62 och HIE119 för protein-TRH-komplexet och HIE62 och HIE119 för apo-proteinet. Dessa två förutsägelser av PROPKA i Maestro motsvarar modellerna med måttlig anrikningsförmåga, med AUC på 0,971 för modell 25 (HIP62 och HIE119) respektive 0,942 för modell 1 (HIE62 och HIE119).

Med tanke på att ovanstående förutsägelser gjorda av olika programvaror skiljer sig avsevärt från varandra bör man vara försiktig när man använder dessa resultat som en riktlinje för att förbereda ett protein för virtuell screening. Utan ingående kunskap om receptorns verkliga protoneringstillstånd samt de ligander som screenas är det svårt att ta itu med detta problem. Därför föreslår vi att en småskalig analys, som den som utfördes i den här studien, och en jämförelse med experimentella data, om de finns tillgängliga, skulle kunna ge en mer exakt beskrivning av protonerings- och rotamertillstånd för de titrerbara resterna i proteinreceptorer för framtida screeningar i större skala. Alternativt kan en modell som inkluderar explicit inkorporering av alternativa protonerings- och rotationstillstånd för sidokedjor under dockning, eventuellt med information lagrad i rutnätet som finns för roterbara hydroxyler och tioler i Glide, vara värd att eftersträva. Undersökning av resultaten med avseende på protoneringstillstånd och rangordningar baserade på interaktioner med histidiner bör undersökas noggrant innan man går vidare till experimentell testning.

Till detta kommer receptorflexibilitet sannolikt att påverka protoneringstillstånden hos de joniserbara resterna. Även om detta inte uttryckligen studerades här, bortsett från minimering av varje receptor efter tilldelning av protoneringstillstånd, är proteinflexibilitet helt klart viktigt för läkemedelsdesign och utveckling . Att betrakta konformations- och protoneringsutrymmet tillsammans blir snabbt svårhanterligt med fysiska metoder som de som beskrivs här, men förbättrade provtagningsmetoder är lovande när det gäller att ta itu med sådana svårigheter . Detta omfattar molekyldynamiska simuleringar med konstant pH, för vilka pH är en extern termodynamisk variabel som används för blind förutsägelse av pKa-värden för de titrerbara resterna . Att effektivt tillämpa resultaten från dessa simuleringar på molekylär design är ett pågående intresseområde. Jämviktsensembler från sådana simuleringar kan användas tillsammans med dockning som en tillämpning av relaxed complex scheme, där virtuell screening utförs med en ensemble av olika protonerade strukturer, för att förbättra anrikningsresultaten . Att ta hänsyn till receptorflexibilitet i målberedningen kommer att leda till ett bredare urval av konformations- och protoneringsutrymmen, vilket förbättrar VS:s prestanda.

Lämna ett svar

Din e-postadress kommer inte publiceras.