Computergestützte Ansätze zur Optimierung der Arzneimittelforschung

Nachricht

HeimHeim / Nachricht / Computergestützte Ansätze zur Optimierung der Arzneimittelforschung

Oct 01, 2023

Computergestützte Ansätze zur Optimierung der Arzneimittelforschung

Naturband 616, Seiten

Nature Band 616, Seiten 673–685 (2023)Diesen Artikel zitieren

28.000 Zugriffe

1 Zitate

371 Altmetrisch

Details zu den Metriken

Die computergestützte Arzneimittelforschung gibt es schon seit Jahrzehnten, obwohl in den letzten Jahren sowohl in der Wissenschaft als auch in der Pharmaindustrie ein tektonischer Wandel hin zur Nutzung rechnergestützter Technologien stattgefunden hat. Dieser Wandel wird größtenteils durch die Flut an Daten zu Ligandeneigenschaften und der Bindung an therapeutische Ziele und deren 3D-Strukturen, umfangreiche Rechenkapazitäten und das Aufkommen virtueller On-Demand-Bibliotheken arzneimittelähnlicher kleiner Moleküle in Milliardenhöhe bestimmt. Um diese Ressourcen optimal nutzen zu können, sind schnelle Rechenmethoden für ein effektives Liganden-Screening erforderlich. Dazu gehört das strukturbasierte virtuelle Screening von chemischen Räumen im Gigamaßstab, das durch schnelle iterative Screening-Ansätze weiter erleichtert wird. Hochsynergistisch sind Entwicklungen bei Deep-Learning-Vorhersagen von Ligandeneigenschaften und Zielaktivitäten anstelle der Rezeptorstruktur. Hier besprechen wir die jüngsten Fortschritte in der Ligandenforschungstechnologie, ihr Potenzial für die Umgestaltung des gesamten Prozesses der Arzneimittelforschung und -entwicklung sowie die Herausforderungen, denen sie gegenüberstehen. Wir diskutieren auch, wie die schnelle Identifizierung äußerst vielfältiger, wirksamer, zielselektiver und wirkstoffähnlicher Liganden für Proteinziele den Prozess der Arzneimittelentdeckung demokratisieren und neue Möglichkeiten für die kostengünstige Entwicklung sichererer und wirksamerer Behandlungen mit kleinen Molekülen eröffnen kann.

Trotz erstaunlicher Fortschritte in den grundlegenden Biowissenschaften und der Biotechnologie sind die Arzneimittelforschung und -entwicklung (DDD) nach wie vor langsam und teuer. Die Herstellung eines niedermolekularen Arzneimittels dauert im Durchschnitt etwa 15 Jahre und etwa 2 Milliarden US-Dollar1. Obwohl anerkannt ist, dass klinische Studien den teuersten Teil der Entwicklung jedes Arzneimittels darstellen, liegen die meisten Möglichkeiten zur Zeit- und Kosteneinsparung in den früheren Entdeckungs- und präklinischen Phasen. Die präklinischen Bemühungen selbst machen mehr als 43 % der Ausgaben in der Pharmabranche aus, zusätzlich zu den großen öffentlichen Mitteln1, was auf die hohe Fluktuationsrate bei jedem Schritt von der Zielauswahl über die Trefferidentifizierung und Lead-Optimierung bis hin zur Auswahl klinischer Kandidaten zurückzuführen ist. Darüber hinaus lässt sich die hohe Ausfallrate bei klinischen Studien (derzeit 90 %)2 größtenteils durch Probleme erklären, die in der frühen Entdeckung liegen, wie etwa unzureichende Zielvalidierung oder suboptimale Ligandeneigenschaften. Die Suche nach schnellen und zugänglichen Wegen zur Entdeckung vielfältigerer Pools hochwertiger chemischer Sonden, Treffer und Leitfäden mit optimalen Absorptions-, Verteilungs-, Metabolismus-, Ausscheidungs- und Toxikologie- (ADMET) und Pharmakokinetik- (PK) Profilen in den frühen Stadien von DDD würde die Ergebnisse verbessern präklinische und klinische Studien und ermöglichen wirksamere, zugänglichere und sicherere Medikamente.

Das Konzept der computergestützten Arzneimittelentwicklung3 wurde in den 1970er-Jahren entwickelt und 1981 vom Fortune-Magazin populär gemacht und hat seitdem mehrere Zyklen des Hypes und der Ernüchterung durchgemacht4. Auf dem Weg dorthin gab es Erfolgsgeschichten5 und im Allgemeinen sind computergestützte Ansätze zu einem integralen, wenn auch bescheidenen Teil des Arzneimittelentwicklungsprozesses geworden6,7. In den letzten Jahren führten jedoch mehrere wissenschaftliche und technologische Durchbrüche zu einem tektonischen Wandel dahingehend, dass rechnergestützte Ansätze sowohl in der Wissenschaft als auch in der Industrie als zentrale Triebkraft für die Arzneimittelentdeckung gelten. Pharma- und Biotech-Unternehmen weiten ihre Bemühungen in der rechnergestützten Wirkstoffforschung aus oder stellen ihre ersten rechnergestützten Chemiker ein. Zahlreiche neue und etablierte Arzneimittelforschungsunternehmen haben in den letzten Jahren mit Geschäftsmodellen, die stark auf einer Kombination aus fortschrittlicher physikbasierter molekularer Modellierung mit Deep Learning (DL) und künstlicher Intelligenz (KI) basieren, Milliardenbeträge eingesammelt. Auch wenn es noch zu früh ist, von den jüngsten rechnergestützten Entdeckungsbemühungen zugelassene Medikamente zu erwarten, bringen sie eine wachsende Zahl klinischer Kandidaten hervor, wobei in einigen Kampagnen gezielt Target-to-Lead-Zeiten von lediglich 1–2 Monaten angegeben werden9,10, oder Ziel-zu-Klinik-Zeit unter 1 Jahr11. Sind dies Anzeichen für einen großen Wandel in der Rolle, die rechnergestützte Ansätze bei der Arzneimittelentwicklung spielen, oder nur eine weitere Runde des Hype-Zyklus?

Schauen wir uns die Schlüsselfaktoren an, die die jüngsten Veränderungen bestimmen (Abb. 1). Erstens hat es die strukturelle Revolution – von der Automatisierung in der Kristallographie12 über die Mikrokristallographie13,14 bis hin zur Kryo-Elektronenmikroskopie-Technologie15,16 – ermöglicht, 3D-Strukturen für die meisten klinisch relevanten Ziele aufzudecken, oft in einem relevanten Zustand oder Molekülkomplex seine biologische Funktion. Besonders beeindruckend war die jüngste Strukturwende bei G-Protein-gekoppelten Rezeptoren (GPCRs)17 und anderen Membranproteinen, die die Wirkung von mehr als 50 % der Arzneimittel18 vermitteln und 3D-Vorlagen für das Liganden-Screening und die Leitstrukturoptimierung liefern. Der zweite Faktor ist eine schnelle und deutliche Erweiterung des arzneimittelähnlichen chemischen Raums, der für die Entdeckung von Treffern und Leitmolekülen leicht zugänglich ist. Noch vor wenigen Jahren war dieser Platz auf mehrere Millionen handelsübliche Verbindungen von Anbietern und firmeninternen Screening-Bibliotheken in der Pharmabranche beschränkt. Jetzt kann das Screening mit extrem großen virtuellen Bibliotheken und chemischen Räumen wirkstoffähnlicher Verbindungen durchgeführt werden, die bei Bedarf problemlos erstellt werden können und schnell auf über Milliarden von Verbindungen anwachsen19, sowie mit noch größeren generativen Räumen mit theoretisch vorhergesagter Synthetisierbarkeit (Kasten 1). . Der dritte Faktor betrifft neu entstehende Rechenansätze, die darauf abzielen, die Fülle an 3D-Strukturen und Ligandendaten voll auszunutzen, unterstützt durch die breite Verfügbarkeit von Cloud- und Grafikverarbeitungseinheiten (GPU)-Rechenressourcen, um diese Methoden in großem Maßstab zu unterstützen. Dazu gehört das strukturbasierte virtuelle Screening extrem großer Bibliotheken20,21,22 unter Verwendung beschleunigter23,24,25 und modularer26 Screening-Ansätze sowie die jüngste Entwicklung von datengesteuerten maschinellen Lern- (ML) und DL-Methoden zur Vorhersage von ADMET und PK Eigenschaften und Aktivitäten27.

a: Mehr als 200.000 Proteinstrukturen im PDB sowie Privatsammlungen enthalten mehr als 90 % der Proteinfamilien, die mit hochauflösenden Röntgen- und neuerdings Kryo-Elektronenmikroskopie-Strukturen abgedeckt sind, oft in unterschiedlichen Funktionszuständen, mit verbleibenden Lücken gefüllt durch Homologie- oder AlphaFold2-Modelle. b) Der für Screening und schnelle Synthese verfügbare chemische Raum ist von etwa 107 verfügbaren Verbindungen im Jahr 2015 auf mehr als 3 × 1010 bedarfsgesteuerte Verbindungen im Jahr 2022 angewachsen und kann schnell auf über 1015 vielfältige und neuartige Verbindungen erweitert werden. c, Zu den Berechnungsmethoden für VLS gehören Fortschritte beim schnellen flexiblen Andocken, modulare fragmentbasierte Algorithmen, DL-Modelle und Hybridansätze. d, Computertools werden durch das schnelle Wachstum von erschwinglichem Cloud Computing, GPU-Beschleunigung und spezialisierten Chips unterstützt.

Obwohl die Auswirkungen der jüngsten strukturellen Revolution17 und der Computerhardware in der Arzneimittelforschung28 an anderer Stelle umfassend besprochen werden, konzentrieren wir uns hier auf die laufende Erweiterung zugänglicher wirkstoffähnlicher chemischer Räume sowie auf aktuelle Entwicklungen bei Computermethoden zur Ligandenentdeckung und -optimierung. Wir erläutern detailliert, wie neue Computerwerkzeuge, die im Gigaspace eingesetzt werden, die kostengünstige Entdeckung von Hunderten oder sogar Tausenden äußerst vielfältiger, wirksamer, zielselektiver und wirkstoffähnlicher Liganden für ein gewünschtes Ziel ermöglichen können, und stellen sie in den Kontext experimenteller Ansätze ( Tabelle 1). Obwohl sich die volle Wirkung neuer Computertechnologien erst langsam auf die klinische Entwicklung auswirkt, gehen wir davon aus, dass ihre synergetische Kombination mit experimentellen Tests und Validierungen im Ökosystem der Arzneimittelentdeckung dessen Effizienz bei der Herstellung besserer Therapeutika deutlich verbessern kann.

Pharmaunternehmen sammeln Sammlungen von Verbindungen für das Screening intern, während Lagerbestände von Lieferanten (siehe Abbildung, Teil a) eine schnelle Lieferung (weniger als eine Woche) ermöglichen, einzigartige und fortschrittliche chemische Gerüste enthalten, leicht durchsuchbar sind und HTS sind kompatibel. Allerdings schränken die hohen Kosten für den Umgang mit physischen Bibliotheken, ihr langsames lineares Wachstum, ihre begrenzte Größe und ihre Neuheit ihre Anwendungen ein.

In jüngerer Zeit ermöglichen virtuelle chemische On-Demand-Datenbanken (vollständig aufgezählt) und Räume (nicht aufgezählt) eine schnelle parallele Synthese aus verfügbaren Bausteinen unter Verwendung validierter oder optimierter Protokolle mit einem Syntheseerfolg von mehr als 80 % und einer Bereitstellung in 2–3 Wochen ( siehe Abbildung, Teil b). Die virtuellen chemischen Räume gewährleisten eine hohe chemische Neuheit und ermöglichen ein schnelles Polynomwachstum durch die Hinzufügung neuer Synthone und Reaktionsgerüste, einschließlich Reaktionen mit mehr als 4 Komponenten. Beispiele hierfür sind Enamine REAL, Galaxy von WuXi, CHEMriya von Otava sowie private Datenbanken und Bereiche bei Pharmaunternehmen.

Generative Räume umfassen im Gegensatz zu On-Demand-Räumen theoretisch mögliche Moleküle und könnten insgesamt den gesamten chemischen Raum umfassen (siehe Abbildung, Teil c). Solche Räume werden nur durch die theoretische Plausibilität begrenzt, die auf 1023–1060 arzneimittelähnlicher Verbindungen geschätzt wird. Obwohl eine umfassende Raumabdeckung möglich ist, sind der Reaktionsweg und die Erfolgsrate der erzeugten Verbindungen unbekannt und erfordern daher eine rechnerische Vorhersage ihrer praktischen Synthetisierbarkeit. Beispiele für generative Räume und ihre Teilmengen sind GDB-13, GDB-17, GDB-18 und GDBChEMBL.

Die begrenzte Größe und Vielfalt der Screening-Bibliotheken stellten lange Zeit ein Hindernis für die Erkennung neuer potenter Liganden und für den gesamten Prozess der Arzneimittelentwicklung dar. Eine durchschnittliche „kostengünstige“ Hochdurchsatz-Screening-Kampagne (HTS)29 verwendet Screening-Bibliotheken mit etwa 50.000–500.000 Verbindungen und dürfte nach der sekundären Validierung nur wenige echte Treffer liefern. Diese Treffer sind, wenn überhaupt, in der Regel eher schwach, nicht selektiv, haben suboptimale ADMET- und PK-Eigenschaften und einen unbekannten Bindungsmodus, so dass ihre Entdeckung jahrelange sorgfältige Versuch-und-Irrtum-Optimierungsbemühungen erfordert, um ein Leitmolekül mit zufriedenstellender Wirksamkeit und so weiter herzustellen die weiteren Voraussetzungen für die präklinische Entwicklung. Eine Skalierung von HTS auf ein paar Millionen Verbindungen ist nur in großen Pharmaunternehmen möglich und macht hinsichtlich der Qualität der resultierenden Treffer immer noch keinen großen Unterschied. Ebenso waren virtuelle Bibliotheken, die In-silico-Screening verwenden, traditionell auf eine Sammlung von Verbindungen beschränkt, die von Anbietern vorrätig waren und in der Regel weniger als 10 Millionen einzigartige Verbindungen umfassten. Daher war der Skalenvorteil gegenüber HTS marginal.

Auch wenn es ein vergebliches Unterfangen ist, die vollständige Abdeckung des riesigen Bereichs arzneimittelähnlicher Chemikalien (geschätzt auf mehr als 1063 Verbindungen)30 zu verfolgen, wird das Screening von On-Demand-Bibliotheken um mehrere Größenordnungen auf Milliarden und mehr bisher unerforschter arzneimittelähnlicher Verbindungen ausgeweitet Es wird erwartet, dass die Entwicklung physischer oder virtueller Verbindungen das Modell der Arzneimittelentwicklung in mehrfacher Hinsicht verändern wird. Erstens kann es die Anzahl potenzieller Treffer im ersten Screening proportional erhöhen31 (Abb. 2). Diese Fülle an Liganden in der Bibliothek erhöht auch die Chancen, wirksamere oder selektivere Liganden sowie Liganden mit besseren physikalisch-chemischen Eigenschaften zu identifizieren. Dies wurde in sehr großen virtuellen Screening-Kampagnen für mehrere Ziele demonstriert und dabei hochwirksame Liganden mit Affinitäten oft im mittleren nanomolaren bis subnanomolaren Bereich entdeckt20,21,22,23,26. Zweitens rationalisiert die Zugänglichkeit von Hit-Analoga in denselben On-Demand-Räumen die Generierung aussagekräftiger Struktur-Aktivitäts-Beziehungen (SAR) pro Katalog und weitere Optimierungsschritte, wodurch der Umfang aufwändiger kundenspezifischer Synthesen reduziert wird. Obwohl die Bibliotheksgröße wichtig ist, können richtig aufgebaute Gigascale-Bibliotheken schließlich die chemische Vielfalt (selbst mit einigen wenigen chemischen Reaktionen32), die chemische Neuheit und die Patentierbarkeit der Treffer erweitern, da fast alle On-Demand-Verbindungen noch nie zuvor synthetisiert wurden.

Die roten Kurven im logarithmischen Maßstab veranschaulichen die Verteilung von Screening-Treffern mit Bindungswerten besser als X für Bibliotheken mit 10 Milliarden, 100 Millionen und 1 Million Verbindungen, wie aus früheren VLS- und V-SYNTHES-Screening-Kampagnen geschätzt. Die blauen Kurven veranschaulichen die ungefähre Abhängigkeit der experimentellen Trefferquote vom vorhergesagten Docking-Score für die Schwellenwerte 10 µM, 1 µM und 100 nM20. Diese Analyse (semiquantitativ, da sie von Ziel zu Ziel variiert) legt nahe, dass das Screening von mehr als 100 Millionen Verbindungen die Einschränkungen kleinerer Bibliotheken aufhebt, das Ende der Trefferverteilung hin zu besseren Bindungswerten mit hohen Trefferraten ausdehnt und dies berücksichtigt Identifizierung proportional experimentellerer Treffer mit höherer Affinität. Beachten Sie auch zwei wichtige Faktoren, die ein weiteres Wachstum der Screening-Bibliotheken auf 10 Milliarden und mehr rechtfertigen: (1) Die Kandidatentreffer für Synthese und experimentelle Tests werden normalerweise als Ergebnis einer zielabhängigen Nachbearbeitung mehrerer Tausend Verbindungen mit der höchsten Bewertung ausgewählt. die nach Neuheit, Diversität, Arzneimittelähnlichkeit und häufig Wechselwirkungen mit spezifischen Rezeptorresten selektiert. Je mehr Verbindungen mit guter Bewertung identifiziert werden, desto besser kann die Gesamtauswahl getroffen werden. (2) Die Sättigung der Trefferquotenkurven bei besten Scores ist keine universelle Regel, sondern ein Ergebnis der begrenzten Genauigkeit der beim Screening verwendeten schnellen Scoring-Funktionen. Die Verwendung genauerer Docking- oder Scoring-Ansätze (flexibles Docking, quantenmechanische und freie Energiestörung) im Nachbearbeitungsschritt kann eine sinnvolle Korrelation des Bindungs-Scores mit der Affinität weiter links erweitern (graue gestrichelte Kurven), was möglicherweise zu noch mehr Treffern mit hoher Affinität führt für Chemieräume im Gigamaßstab.

Kürzlich wurden mehrere Ansätze entwickelt, um die Grenzen der Bibliotheksgröße in HTS zu verschieben, einschließlich kombinatorischer Chemie und groß angelegter Poolung der Verbindungen für parallele Tests. Beispielsweise können Techniken der Affinitätsselektions-Massenspektrometrie angewendet werden, um Bindemittel direkt in Pools von Tausenden von Verbindungen zu identifizieren33, ohne dass eine Markierung erforderlich ist. Es wurden auch DNA-kodierte Bibliotheken (DELs) und kostengünstige Ansätze zu deren Erstellung und Screening entwickelt34, die es ermöglichen, mit bis zu etwa 1010 Verbindungen in einem einzigen Reagenzglas zu arbeiten35. Diese Methoden haben ihre eigenen Einschränkungen; Da DELs durch das Markieren von Liganden mit einzigartigen DNA-Sequenzen über einen Linker erstellt werden, schränkt die DNA-Konjugation die möglichen Chemien für den kombinatorischen Aufbau der Bibliothek ein. Das Screening von DELs kann auch zu einer großen Anzahl falsch-negativer Ergebnisse führen, indem wichtige Einheiten für die Bindung blockiert werden, und, was noch wichtiger ist, falsch-positiven Ergebnissen durch unspezifische Bindung von DNA-Markierungen, so dass für deren Validierung eine teure Off-DNA-Resynthese der Trefferverbindungen erforderlich ist. Um diese Neusynthese zu vermeiden, wurde vorgeschlagen, ML-Modi zu verwenden, die auf DEL-Ergebnissen für jedes Ziel trainiert wurden, um arzneimittelähnliche Liganden aus bedarfsgesteuerten chemischen Räumen vorherzusagen, wie in Lit. beschrieben. 36.

Das In-silico-Screening virtueller Bibliotheken durch schnelle Rechenansätze wird seit langem als kostengünstige Möglichkeit zur Überwindung der Einschränkungen physischer Bibliotheken angepriesen. Allerdings wurden erst kürzlich Ansätze der synthetischen Chemie und der Cheminformatik entwickelt, um diese Grenzen zu überwinden und virtuelle On-Demand-Bibliotheken aufzubauen, die einen viel größeren chemischen Raum erforschen, wie in Lit. beschrieben. 37,38. Im Jahr 2017 wurde die leicht zugängliche (REAL) Datenbank von Enamine19,39 die erste kommerziell verfügbare On-Demand-Bibliothek basierend auf dem robusten Reaktionsprinzip40, während die US-amerikanischen National Institutes of Health das synthetisch zugängliche virtuelle Inventar (SAVI)41 entwickelten, das ebenfalls verwendet wird Enamin-Bausteine. Die REAL-Datenbank verwendet sorgfältig ausgewählte und optimierte parallele Syntheseprotokolle und eine kuratierte Sammlung vorrätiger Bausteine, wodurch eine schnelle (weniger als 4 Wochen), zuverlässige (80 % Erfolgsquote) und kostengünstige Synthese einer Reihe von Bausteinen gewährleistet werden kann Verbindungen21. Angetrieben durch neue Reaktionen und vielfältige Bausteine ​​ist die vollständig aufgezählte REAL-Datenbank von etwa 170 Millionen Verbindungen im Jahr 2017 auf mehr als 5,5 Milliarden Verbindungen im Jahr 2022 angewachsen und macht den Großteil der beliebten virtuellen ZINC20-Screening-Datenbank42 aus. Der praktische Nutzen der REAL-Datenbank wurde kürzlich in mehreren großen prospektiven Screening-Kampagnen demonstriert20,21,23,24, von denen einige weitere Schritte zur Hit-Optimierung im gleichen chemischen Bereich durchführten und selektive nanomolare und sogar subnanomolare Liganden ohne jegliche Anpassung lieferten Synthese20,21. Ähnliche sehr große virtuelle Bibliotheken (d. h. GalaXi (http://www.wuxiapptec.com) und CHEMriya (http://chemriya.com)) sind im Handel erhältlich, ihre Erfolgsraten bei der Synthese müssen jedoch noch veröffentlicht werden.

Der modulare Charakter virtueller On-Demand-Bibliotheken unterstützt weiteres Wachstum durch das Hinzufügen von Reaktionen und Bausteinen. Der Aufbau, die Pflege und die Suche vollständig aufgezählter chemischer Bibliotheken, die mehr als ein paar Milliarden Verbindungen umfassen, werden jedoch langsam und unpraktisch. Solche virtuellen Bibliotheken im Gigamaßstab werden daher normalerweise als nicht aufgezählte chemische Räume verwaltet, die durch einen bestimmten Satz von Bausteinen und Reaktionen (oder Transformationen) definiert sind, wie in Lit. ausführlich besprochen. 38. Eines der ersten veröffentlichten Beispiele im Pharmabereich ist PGVL von Pfizer37,43, dessen neueste Version einen Satz von 1.244 Reaktionen und firmeninternen Reagenzien verwendet, um 1014 Verbindungen zu berücksichtigen. Andere Biopharmaunternehmen verfügen über eigene virtuelle chemische Räume38,44, deren Details jedoch häufig nicht öffentlich zugänglich sind. Unter den kommerziell verfügbaren Chemieräumen gehören GalaXi Space von WuXi (ca. 8 Milliarden Verbindungen), CHEMriya von Otava (11,8 Milliarden Verbindungen) und Enamine REAL Space (36 Milliarden Verbindungen)45 zu den größten und etabliertesten. Zusätzlich zu ihrer enormen Größe sind diese virtuellen Räume äußerst neuartig und vielfältig und weisen nur minimale Überlappungen (weniger als 10 %) untereinander auf46. Der derzeit größte kommerzielle Raum, Enamine REAL Space, ist eine Erweiterung der REAL-Datenbank, die die gleichen synthetischen Geschwindigkeits-, Geschwindigkeits- und Kostengarantien beibehält und mehr als 170 Reaktionen und mehr als 137.000 Bausteine ​​abdeckt (Kasten 1). Bei den meisten dieser Reaktionen handelt es sich um Zweikomponenten- oder Dreikomponentenreaktionen, aber es werden auch mehr Vierkomponenten- oder sogar Fünfkomponentenreaktionen untersucht, die eine Kombinatorik höherer Ordnung ermöglichen. Dieser Raum kann auf der Grundlage verfügbarer Reaktionen und erweiterter Bausteinsätze leicht auf 1015 Verbindungen erweitert werden, beispielsweise auf 680 Millionen Make-on-Demand-Bausteine ​​(MADE),47 obwohl die Synthese solcher Verbindungen mehr Schritte erfordert und teurer ist. Um kombinatorische chemische Räume ohne ihre vollständige Aufzählung darzustellen und zu navigieren, wurden spezielle Werkzeuge der Cheminformatik entwickelt, von fragmentbasierten chemischen Ähnlichkeitssuchen48 bis hin zu ausgefeilteren 3D-Suchmethoden für molekulare Ähnlichkeiten auf der Grundlage atomarer Eigenschaftsfelder wie der Rapid Isostere Discovery Engine (RIDE)38.

Ein alternativer Ansatz zum Aufbau chemischer Räume erzeugt hypothetisch synthetisierbare Verbindungen nach einfachen Regeln der synthetischen Durchführbarkeit und chemischen Stabilität. Somit sagen die generierten Datenbanken (GDB) Verbindungen voraus, die aus einer bestimmten Anzahl von Atomen bestehen können; Beispielsweise enthielt GDB-17 166,4 Milliarden Moleküle mit bis zu 17 Atomen von C, N, O, S und Halogenen49, während GDB-18 aus 18 Atomen schätzungsweise 1013 Verbindungen ergeben würde38. Andere generative Ansätze, die auf engeren Definitionen chemischer Räume basieren, werden jetzt beim De-novo-Ligandendesign mit DL-basierter generativer Chemie verwendet (z. B. Lit. 50), wie unten erläutert.

Obwohl die synthetischen Erfolgsraten für einige der kommerziellen On-Demand-Chemieräume (z. B. Enamine REAL Space) gründlich validiert wurden20,21,22,23,24,26,42 bleiben die synthetischen Zugänglichkeiten und Erfolgsraten anderer chemischer Räume bestehen unveröffentlicht38. Dies sind wichtige Kennzahlen für die praktische Nachhaltigkeit der On-Demand-Synthese, da geringere Erfolgsraten oder unangemessener Zeit- und Kostenaufwand ihren Vorteil gegenüber der kundenspezifischen Synthese schmälern würden.

Chemische Räume im Giga- und Terra-Maßstab werden voraussichtlich Millionen potenzieller Treffer und Tausende potenzieller Leitserien für jedes Ziel beherbergen, sofern sie eine hohe Drogenähnlichkeit und -vielfalt bewahren. Darüber hinaus vereinfacht ihre äußerst beherrschbare, robuste Synthese alle nachgelagerten medizinischen Chemiebemühungen für endgültige Arzneimittelkandidaten.

Der Umgang mit solchen virtuellen Bibliotheken erfordert jedoch neue Rechenansätze, die besondere Anforderungen an Geschwindigkeit und Genauigkeit erfüllen. Sie müssen schnell genug sein, um mit Gigascale-Bibliotheken zurechtzukommen. Wenn das Andocken einer Verbindung 10 s pro CPU-Kern dauert, würde es mehr als 3.000 Jahre dauern, 1010 Verbindungen auf einem einzelnen CPU-Kern zu überprüfen, oder in einer Computing-Cloud mit den günstigsten CPU-Raten etwa 1 Million US-Dollar kosten. Gleichzeitig muss das Gigascale-Screening äußerst genau sein und vor falsch-positiven Treffern schützen, die die Bewertungsfunktion effektiv betrügen, indem sie ihre Lücken und Näherungen ausnutzen31. Selbst eine Falsch-Positiv-Rate von eins zu einer Million in einer 1010-Verbindungsbibliothek würde 10.000 falsche Treffer umfassen, was dazu führen könnte, dass jede Trefferkandidatenauswahl überschwemmt wird. Die Artefaktrate und -art kann vom Ziel und den Screening-Algorithmen abhängen und sollte beim Screening und der Nachbearbeitung sorgfältig berücksichtigt werden. Obwohl es für solche Artefakte keine einfache Lösung gibt, gibt es einige praktische und einigermaßen kostengünstige Abhilfemaßnahmen: (1) Auswahl auf der Grundlage des Konsenses zweier unterschiedlicher Bewertungsfunktionen, (2) Auswahl äußerst unterschiedlicher Treffer (viele Artefakte gruppieren sich zu ähnlichen Verbindungen). ), (3) Absicherung der Wetten aus mehreren Ergebnisbereichen31 und (4) manuelle Kuratierung der endgültigen Liste der Verbindungen für etwaige ungewöhnliche Wechselwirkungen. Letztendlich ist es äußerst wünschenswert, so viele verbleibende „Lücken in den Scoring-Funktionen“ wie möglich zu schließen und sie erneut zu optimieren, um eine hohe Selektivität in dem Score-Bereich zu erreichen, in dem die besten Hits von Gigaspace zu finden sind. Das Fehlen einiger Treffer beim Screening (falsche Negative) würde aufgrund der großen Anzahl potenzieller Treffer im Bereich von 1010 gut toleriert werden (z. B. ist der Verlust von 50 % einer Million potenzieller Treffer völlig in Ordnung), sodass ein gewisser Kompromiss bei der Bewertungsempfindlichkeit erforderlich ist ist akzeptabel.

Die wichtigsten Arten von Computeransätzen zum Screening eines Proteinziels auf potenzielle Liganden sind in Tabelle 2 zusammengefasst. Im Folgenden diskutieren wir einige neue Technologien und wie sie sich am besten in die gesamte DDD-Pipeline einfügen lassen, um die wachsenden On-Demand-Chemieräume voll auszunutzen.

In-silico-Screening durch Andocken von Molekülen der virtuellen Bibliothek an eine Rezeptorstruktur und Vorhersage ihres „Bindungs-Scores“ ist ein etablierter Ansatz zur Hit-and-Lead-Entdeckung und spielte eine Schlüsselrolle in den jüngsten Erfolgsgeschichten der Arzneimittelentdeckung11,17,51. Der Docking-Vorgang selbst kann die molekulare Mechanik nutzen, häufig in interner Koordinatendarstellung, um eine schnelle Konformationsprobenahme vollständig flexibler Liganden durchzuführen52,53, empirische 3D-Formanpassungsansätze verwenden54,55 oder sie in einem hybriden Docking-Trichter kombinieren56,57. Besonderes Augenmerk wird auf Liganden-Scoring-Funktionen gelegt, die darauf ausgelegt sind, Nicht-Binder zuverlässig zu entfernen, um falsch-positive Vorhersagen zu minimieren, was besonders relevant ist, wenn die Bibliotheksgröße zunimmt. Blindbewertungen der Leistung strukturbasierter Algorithmen wurden routinemäßig im Rahmen einer D3R Grand Challenge-Gemeinschaftsinitiative58,59 durchgeführt und zeigten kontinuierliche Verbesserungen bei der Vorhersage der Ligandenposition und der Bindungsenergie für die besten Algorithmen.

Im Laufe der Jahre wurden Ergebnisse der vielen erfolgreichen strukturbasierten prospektiven Screening-Kampagnen veröffentlicht, die alle wichtigen Zielklassen abdecken, zuletzt GPCRs, wie in Lit. besprochen. 17,51,60, während unzählige weitere in der Industrie eingesetzt wurden. Die fokussierten Ligandenkandidatensätze, die durch ein solches Screening vorhergesagt werden, zeigen in experimentellen Tests häufig nützliche Trefferraten (10–40 %). am wenigsten). Weitere Schritte zur Optimierung der ersten Treffer, die aus Standard-Screening-Bibliotheken mit weniger als 10 Millionen Verbindungen erhalten wurden, erfordern jedoch normalerweise eine teure, kundenspezifische Synthese von Analoga, die nur in wenigen veröffentlichten Fällen möglich war20,61.

Die direkte Identifizierung von Treffern in viel größeren chemischen Räumen wie dem REAL Space kann nicht nur zu mehr und besseren Treffern führen31, sondern unterstützt auch deren Optimierung, da jeder resultierende Treffer Tausende von Analoga und Derivaten im selben On-Demand-Raum aufweist. Dieser Vorteil war besonders hilfreich für solch anspruchsvolle Ziele wie die SARS-CoV-2-Hauptprotease (Mpro), bei der Hunderte von Standardversuchen zum virtuellen Liganden-Screening (VLS) leer ausgingen62 (siehe Diskussion über Mpro-Herausforderungen in „Hybrid in vitro– „in silico-Ansätze“ weiter unten). Obwohl die anfänglichen Trefferquoten selbst in den ultragroßen Bildschirmen niedrig waren, identifizierte VirtualFlow24 der REAL-Datenbank mit 1,4 Milliarden Verbindungen immer noch Treffer im Bereich von 10–100 µM, die über eine On-Demand-Synthese63 optimiert wurden, um hochwertige Leads mit zu liefern beste Verbindung Z222979552 (halbmaximale Hemmkonzentration (IC50) = 1,0 μM). Ein weiteres ultragroßes Screening von 235 Millionen Verbindungen, basierend auf einer neueren Mpro-Struktur mit einem nichtkovalenten Inhibitor (Protein Data Bank (PDB) ID: 6W63), lieferte ebenfalls brauchbare Treffer, deren schnelle Optimierung zur Entdeckung von nanomolarem Mpro führte Inhibitoren in nur 4 Monaten durch eine Kombination aus bedarfsgerechter und einfacher kundenspezifischer Chemie64. Die beste Verbindung in dieser Arbeit hatte gute In-vitro-ADMET-Eigenschaften mit einer Affinität von 38 nM und einer zellbasierten antiviralen Wirksamkeit von 77 nM, die mit dem klinisch verwendeten PF-07321332 (Nirmatrelvir)65 vergleichbar sind.

Mit zunehmender Bibliotheksgröße werden die Rechenzeit und die Kosten für das Andocken selbst zum größten Engpass beim Screening, selbst bei massiv parallelem Cloud Computing60. Kürzlich wurden iterative Ansätze vorgeschlagen, um Bibliotheken dieser Größe in Angriff zu nehmen. Beispielsweise nutzte VirtualFlow die schrittweise Filterung der gesamten Bibliothek mit Docking-Algorithmen zunehmender Genauigkeit, um etwa 1,4 Milliarden Enamin-REAL-Verbindungen zu screenen23,24. Obwohl sich die Geschwindigkeit um ein Vielfaches verbessert, erfordert die Methode immer noch eine vollständig aufgezählte Bibliothek und ihr Rechenaufwand wächst linear mit der Anzahl der Verbindungen, was ihre Anwendbarkeit in schnell wachsenden chemischen Räumen einschränkt.

Die Idee, Moleküle aus einem begrenzten Satz von Fragmenten zu entwerfen, um die Rezeptorbindungstasche optimal zu füllen, wurde schon in den frühen Jahren der Arzneimittelentwicklung verfolgt und beispielsweise im LUDI-Algorithmus umgesetzt66. Allerdings blieb die kundenspezifische Synthese der entworfenen Verbindungen der größte Engpass bei solchen Ansätzen. Die kürzlich entwickelte Technologie des Virtual Synthon Hierarchical Enumeration Screening (V-SYNTHES)26 wendet fragmentbasiertes Design auf bedarfsgesteuerte chemische Räume an und vermeidet so die Herausforderungen einer kundenspezifischen Synthese (Abb. 3). Ausgehend vom Katalog der REAL-Space-Reaktionen und Bausteine ​​(Synthes) erstellt V-SYNTHES zunächst eine minimale Bibliothek repräsentativer chemischer Fragmente, indem es die Synthones an einem der Bindungspunkte vollständig aufzählt und die andere Position (oder Positionen) mit einem Methyl- oder Capping abschließt Phenylgruppe. Das Docking-basierte Screening ermöglicht dann die Auswahl der Fragmente mit der höchsten Bewertung (z. B. die besten 0,1 %), von denen vorhergesagt wird, dass sie sich gut in die Zieltasche binden. Dies wird für eine zweite Position wiederholt (und dann für die dritte und vierte Position, falls verfügbar), und die resultierenden fokussierten Bibliotheken werden bei jeder Iteration mit der Zieltasche abgeglichen. Im letzten Schritt werden die rund 50.000 besten Vollverbindungen von REAL Space mit ausgefeilteren und genaueren Docking-Parametern oder -Methoden angedockt und die Spitzenkandidaten werden nach Neuheit, Diversität und Vielfalt der gewünschten arzneimittelähnlichen Eigenschaften gefiltert. In der Nachbearbeitung werden die besten 50–500 Verbindungen für die Synthese und Prüfung ausgewählt. Unsere Einschätzung legt nahe, dass die Kombination von Synthons mit den Gerüsten und deren Abdeckung mit Dummy-Minimalgruppen im V-SYNTHES-Algorithmus eine entscheidende Voraussetzung für optimale Fragmentvorhersagen ist, da reaktive Gruppen von Bausteinen und Gerüsten häufig starke, aber falsche Wechselwirkungen erzeugen, die nicht vorhanden sind im gesamten Molekül. Ein weiterer wichtiger Teil des Algorithmus ist die Bewertung der Fragmentbindungsposition im Ziel, die jene Treffer mit minimalen Kappen priorisiert, die auf einen Bereich der Tasche gerichtet sind, in dem das Fragment Platz zum Wachsen hat.

Ein Überblick über den V-SYNTHES-Algorithmus, der ein effektives Screening von mehr als 31 Milliarden Verbindungen im REAL Space oder sogar größeren chemischen Räumen ermöglicht und dabei nur kleine Fraktionen von Molekülen zählt und andockt. Der Algorithmus, der hier anhand einer Zweikomponentenreaktion auf Basis eines Sulfonamidgerüsts mit R1- und R2-Synthons veranschaulicht wird, kann auf Hunderte optimierter Zweikomponenten-, Dreikomponenten- oder Mehrkomponentenreaktionen angewendet werden, indem die Schritte 3 und 4 iterativ wiederholt werden, bis sie vollständig sind Es werden aufgezählte Moleküle erhalten, die optimal in die Zieltasche passen. Schmerzen, Pan-Assay-Interferenzverbindungen.

V-SYNTHES wurde ursprünglich zur Entdeckung neuer Chemotypen für Cannabinoidrezeptor-CB2-Antagonisten eingesetzt und hat eine Trefferquote von 23 % für submikromolare Liganden gezeigt, was die Trefferquote von Standard-VLS um das Fünffache übersteigt und dabei etwa 100-mal weniger Rechenressourcen beansprucht26. Eine ähnliche Trefferquote wurde für das ROCK1-Kinase-Screening in derselben Studie gefunden, mit einem Treffer im niedrigen nanomolaren Bereich26. V-SYNTHES wird auf andere therapeutisch relevante Ziele mit klar definierten Taschenstrukturen angewendet.

Ein ähnlicher Ansatz, Chemical Space Docking, wurde von BioSolveIT bisher für Zweikomponentenreaktionen implementiert67. Diese Methode ist noch schneller, da sie einzelne Bausteinfragmente andockt und diese dann mit Gerüsten und anderen Synthons aufzählt. Allerdings gibt es auch Nachteile für die höhere Geschwindigkeit: Das Andocken kleinerer Fragmente ohne Gerüste ist weniger zuverlässig und ihre reaktiven Gruppen weisen häufig andere Eigenschaften als das Reaktionsprodukt auf. Dies kann zu starken Rezeptorwechselwirkungen führen, die für die Endverbindung irrelevant sind und die Fragmentauswahl verfälschen können. Dies gilt insbesondere für Cycloaddiction-Reaktionen und Dreikomponentengerüste, die beim Andocken im chemischen Raum einer weiteren Validierung bedürfen.

Strukturbasierte modulare Ansätze unterstützen nicht nur die Häufigkeit, chemische Diversität und potenzielle Qualität von Treffern, sondern sind auch besonders effektiv bei der Identifizierung von Treffern mit robuster chemischer Neuheit, da sie (1) nicht auf Informationen zu vorhandenen Liganden angewiesen sind und (2) Liganden identifizieren, die wurden noch nie zuvor synthetisiert. Dies ist ein wichtiger Faktor, um die Patentierbarkeit der chemischen Substanz für Hit-Verbindungen und Leitreihen aus dem Gigascale-Screening sicherzustellen. Darüber hinaus gewährleisten Tausende leicht synthetisierbarer Analoga ein umfangreiches SAR nach Katalog für die besten Treffer, was beispielsweise eine etwa 100-fache Verbesserung der Wirksamkeit und Selektivität der CB2 V-SYNTHES-Hits26 ermöglichte. Die Verfügbarkeit der mehrschichtigen On-Demand-Erweiterungen des chemischen Raums (z. B. unterstützt durch MADE-Bausteine47) kann auch die nächsten Schritte bei der Lead-Optimierung durch „virtuelles MedChem“ erheblich rationalisieren und so umfangreiche kundenspezifische Synthesen reduzieren.

Im Zeitalter der KI-basierten Gesichtserkennung, ChatGPT und AlphaFold68 besteht ein enormes Interesse an Anwendungen datengesteuerter DL-Ansätze in der gesamten Arzneimittelforschung, von der Zielidentifizierung über die Lead-Optimierung bis hin zur translationalen Medizin (wie in Lit. 69,70,71 besprochen). ).

Datengesteuerte Ansätze haben in der Arzneimittelforschung eine lange Geschichte, in der ML-Algorithmen wie Support Vector Machine, Random Forest und neuronale Netze in großem Umfang zur Vorhersage von Ligandeneigenschaften und On-Target-Aktivitäten eingesetzt wurden, wenn auch mit gemischten Ergebnissen. Genaue quantitative Struktur-Eigenschafts-Beziehungsmodelle (QSPR) können physikochemische (z. B. Löslichkeit und Lipophilie) und pharmakokinetische (z. B. Bioverfügbarkeit und Durchdringung der Blut-Hirn-Schranke) Eigenschaften vorhersagen, in denen große und breite experimentelle Datensätze für das Modelltraining verfügbar sind weiter wachsen72,73,74. ML ist auch in vielen quantitativen SAR-Algorithmen (QSAR)75 implementiert, bei denen der Trainingssatz und die daraus resultierenden Modelle auf ein bestimmtes Ziel und ein chemisches Gerüst ausgerichtet sind und so die Optimierung der Leitaffinität und Wirksamkeit unterstützen. Für die Neuverwendung von Arzneimitteln wurden auch Methoden vorgeschlagen, die auf umfangreichen Ligand-Target-Bindungsdatensätzen, Clustering chemischer Ähnlichkeiten und netzwerkbasierten Ansätzen basieren76,77.

Das Aufkommen von DL bringt datengesteuerte Modelle auf die nächste Ebene und ermöglicht die Analyse viel größerer und vielfältiger Datensätze bei gleichzeitiger Ableitung komplizierterer nichtlinearer Beziehungen, wobei umfangreiche Literatur spezifische DL-Methoden und Anwendungen für die Arzneimittelforschung beschreibt27,70. Aufgrund ihres „Lernens aus Beispielen“ erfordert KI umfassende Ligandendatensätze zum Trainieren der Vorhersagemodelle. Für QSPR wurden große öffentliche und private Datenbanken zusammengestellt, in denen verschiedene Eigenschaften wie Löslichkeit, Lipophilie oder In-vitro-Proxys für die orale Bioverfügbarkeit und Gehirnpermeabilität für viele tausend verschiedene Verbindungen experimentell gemessen wurden, was die Vorhersage dieser Eigenschaften in einem breiten Spektrum neuer Verbindungen ermöglicht Verbindungen.

Die Qualität von QSAR-Modellen unterscheidet sich jedoch je nach Datenverfügbarkeit für verschiedene Zielklassen, wobei die größten Fortschritte für die Kinase-Superfamilie und aminerge GPCRs erzielt wurden. Ein unvoreingenommener Benchmark der besten ML-QSAR-Modelle wurde kürzlich im Rahmen einer IDG-DREAM Drug-Kinase Binding Prediction Challenge unter Beteiligung von mehr als 200 Experten bereitgestellt78. Zu den besten Vorhersagemodellen in dieser Blindbewertung gehörten Kernel-Learning, Gradient Boosting und DL-basierte Algorithmen. Das leistungsstärkste Modell (vom Team QED) verwendete als Trainingsdaten eine Kernel-Regression, Proteinsequenzähnlichkeit und Affinitätswerte von mehr als 60.000 Verbindung-Kinase-Paaren zwischen 13.608 Verbindungen und 527 Kinasen aus den Datenbanken ChEMBL79 und Drug Target Commons80. Das beste DL-Modell nutzte bis zu 900.000 experimentelle Ligandenbindungsdatenpunkte für das Training, blieb aber hinsichtlich der Leistung immer noch hinter dem viel einfacheren Kernel-Modell zurück. Die besten Modelle erreichten einen Spearman-Rangkoeffizienten von 0,53 mit einem quadratischen Mittelwertfehler von 0,95 für die vorhergesagten versus experimentellen pKd-Werte im Challenge-Set. Es wurde festgestellt, dass diese Genauigkeit mit der Genauigkeit und dem Rückruf von experimentellen Einzelpunkttests zur Kinasehemmung vergleichbar ist und bei der Suche nach den ersten Treffern für weniger erforschte Kinasen und bei der Leitoptimierung hilfreich sein kann. Beachten Sie jedoch, dass die Kinasefamilie einzigartig ist, da sie die größte Klasse von mehr als 500 Zielen darstellt, die alle über ähnliche orthosterische Bindungstaschen verfügen und eine hohe Kreuzselektivität aufweisen. Die entfernte zweite Familie mit systematischer Kreuzreaktivität umfasst etwa 50 aminerge GPCRs, während andere GPCR-Familien und andere kreuzreaktive Proteinfamilien viel kleiner sind. Die Leistung und Generalisierbarkeit von ML- und DL-Methoden für diese und andere Ziele müssen noch getestet werden.

Die Entwicklung allgemein verallgemeinerbarer oder sogar universeller Modelle ist das zentrale Ziel der KI-gesteuerten Arzneimittelentwicklung. Eine der Richtungen hier besteht darin, allgemeine Modelle von Bindungsaffinitäten (Bindungs-Score-Funktionen) aus Daten sowohl zu bekannten Ligandenaktivitäten als auch zu entsprechenden Protein-Ligand-3D-Strukturen zu extrahieren, die beispielsweise in der PDBbind-Datenbank81 gesammelt oder durch Docking erhalten wurden. Solche Modelle untersuchen verschiedene Ansätze zur Darstellung der Daten- und Netzwerkarchitekturen, einschließlich räumlicher Graph-Faltungsmodelle82,83, dreidimensionaler tiefer Faltungs-Neuronaler Netze84,85 oder deren Kombinationen86. Eine aktuelle Studie ergab jedoch, dass unabhängig von der Architektur des neuronalen Netzwerks eine explizite Beschreibung nichtkovalenter intermolekularer Wechselwirkungen in den PDBbind-Komplexen keinen statistischen Vorteil im Vergleich zu einfacheren Näherungen nur des Liganden oder nur des Rezeptors bietet, bei denen die Wechselwirkungen weggelassen werden87. Daher beruhen die guten Leistungen von DL-Modellen auf Basis von PDBbind auf der Speicherung ähnlicher Liganden und Rezeptoren und nicht auf der Erfassung allgemeiner Informationen über deren Bindung. Eine mögliche Erklärung für dieses Phänomen ist, dass die PDBbind-Datenbank nicht über eine angemessene Darstellung des „negativen Raums“ verfügt, d. h. Liganden mit suboptimalen Interaktionsmustern, um das Training durchzusetzen.

Dieses Missgeschick verdeutlicht die Notwendigkeit eines besseren Verständnisses des Verhaltens von DL-Modellen und ihrer Abhängigkeit von den Trainingsdaten, was in der KI-Community weithin anerkannt ist. Es hat sich gezeigt, dass DL-Modelle, insbesondere auf der Grundlage begrenzter Datensätze ohne negative Daten, anfällig für Übertraining und fehlerhafte Leistung sind, was manchmal dazu führt, dass ganze Klassen von Modellen als „nutzlos“88 oder durch subjektive Faktoren, die den Trainingsdatensatz definieren, stark verzerrt werden89. Es werden statistische Tools entwickelt, um den Anwendungsbereich zu definieren und die Leistung der Modelle sorgfältig zu validieren. Eines der vorgeschlagenen Konzepte ist das Vorhersagbarkeits-, Berechenbarkeits- und Stabilitätsgerüst für die „veridical data science“90. Eine angemessene Auswahl hochwertiger Daten wurde von Führungskräften der KI-Gemeinschaft ausdrücklich als Hauptvoraussetzung für die Schließung der „Produktionslücke“ oder der Unfähigkeit von ML-Modellen, beim Einsatz in der realen Welt erfolgreich zu sein, identifiziert. zentrischer Ansatz für AI91,92. Es gab auch Versuche, Werkzeuge zu entwickeln, um KI „erklärbar“ zu machen, d.

Trotz dieser Herausforderungen und Einschränkungen beginnt die KI bereits einen erheblichen Einfluss auf die Arzneimittelentwicklung zu haben, da die ersten KI-basierten Arzneimittelkandidaten es in die präklinischen und klinischen Studien schaffen. Bei Kinasen wurden die AI-gesteuerten Verbindungen als starke und wirksame In-vivo-Inhibitoren der Rezeptortyrosinkinase DDR1 beschrieben, die an der Fibrose beteiligt ist9. Für ISM001-055 (auch bekannt als INS018_055) zur Behandlung der idiopathischen Lungenfibrose10 wurden klinische Phase-I-Studien angekündigt, obwohl die Identität der Verbindung und ihres Ziels nicht bekannt gegeben wurde. Bei GPCRs sind kürzlich KI-gesteuerte Verbindungen, die auf 5-HT1A-, duale 5-HT1A-5-HT2A- und A2A-Rezeptoren abzielen, in klinische Studien eingetreten, was das Konzept der KI-gesteuerten Arzneimittelentwicklung weiter unterstützt. Diese ersten Erfolgsgeschichten stammen aus Kinase- und GPCR-Familien mit bereits gut untersuchter Pharmakologie, und die Verbindungen weisen eine große chemische Ähnlichkeit mit bekannten hochaffinen Gerüsten auf94. Für die nächste Generation von DL-Arzneimittelkandidaten ist es wichtig, sich hinsichtlich Neuheit und Anwendbarkeit zu verbessern.

Wie oben erläutert, haben physikbasierte und datengesteuerte Ansätze deutliche Vorteile und Einschränkungen bei der Vorhersage der Ligandenwirksamkeit. Strukturbasierte Docking-Vorhersagen lassen sich natürlich auf jedes Ziel mit 3D-Strukturen übertragen und können genauer sein, insbesondere bei der Eliminierung falsch positiver Ergebnisse als größte Herausforderung beim Screening. Umgekehrt funktionieren datengesteuerte Methoden möglicherweise anstelle von Strukturen und können schneller sein, insbesondere mit GPU-Beschleunigung, obwohl es ihnen schwerfällt, über datenreiche Zielklassen hinaus zu verallgemeinern. Daher gibt es zahlreiche laufende Bemühungen, physikbasierte und datengesteuerte Ansätze auf synergetische Weise im Allgemeinen95 und in der Arzneimittelforschung im Besonderen96 zu kombinieren.

Bei virtuellen Screening-Ansätzen kann eine synergetische Nutzung des physikbasierten Dockings mit datenbasierten Bewertungsfunktionen von großem Nutzen sein. Wenn außerdem die physikbasierten und datenbasierten Bewertungsfunktionen relativ unabhängig sind und beide eine Anreicherung in den ausgewählten fokussierten Bibliotheken erzeugen, kann ihre Kombination die Falsch-Positiv-Raten reduzieren und die Qualität der Treffer verbessern. Diese Synergie spiegelt sich in den neuesten 3DR Grand Challenge 4-Ergebnissen für Liganden-IC50-Vorhersagen wider59, in denen die Top-Methoden, die eine Kombination aus physikbasierter und ML-Bewertung verwendeten, diejenigen übertrafen, die kein ML verwendeten. Künftig wird ein gründliches Benchmarking von physikbasierten, ML- und Hybridansätzen ein zentraler Schwerpunkt einer neuen kritischen Bewertung von Computational Hit-Finding Experiments (CACHE) sein, in der fünf spezifische Szenarien bewertet werden, die für die praktische Treffer- und Lead-Erkennung und -Optimierung relevant sind97.

Auf einer tieferen Ebene können die Ergebnisse des genauen physikbasierten Dockings (zusätzlich zu experimentellen Daten, beispielsweise von PDBbind81) verwendet werden, um verallgemeinerte Diagramme oder 3D-DL-Modelle zu trainieren, die die Ligand-Rezeptor-Affinität vorhersagen. Dies würde dazu beitragen, den Trainingsdatensatz deutlich zu erweitern und positive und negative Beispiele (suboptimale Bindung) auszugleichen, was wichtig ist, um die in Ref. beschriebenen Übertrainingsprobleme zu vermeiden. 87. Solche DL-basierten 3D-Bewertungsfunktionen zur Vorhersage der molekularen Bindungsaffinität eines angedockten Protein-Ligand-Komplexes werden entwickelt und einem Benchmarking unterzogen, zuletzt RTCNN98, obwohl ihr praktischer Nutzen noch nachgewiesen werden muss.

Um den Anwendungsbereich des strukturbasierten Dockings auf Ziele ohne hochauflösende Strukturen zu erweitern, ist es auch verlockend, die von der KI abgeleiteten 3D-Modelle AlphaFold2 (Ref. 99,100) oder RosettaFold101 zu verwenden, die sich bereits in vielen Anwendungen, einschließlich Protein-, als nützlich erweisen. Protein- und Protein-Peptid-Docking102. Traditionelle Homologiemodelle, die auf einer hohen Proteinähnlichkeit basieren, insbesondere wenn sie mit bekannten Liganden verfeinert werden103, wurden beim Andocken kleiner Moleküle und beim virtuellen Screening104 verwendet. Daher wird erwartet, dass AlphaFold2 den Umfang der Strukturmodellierung und ihre Genauigkeit weiter erweitern wird. In einem aktuellen Bericht halfen AlphaFold2-Modelle, ergänzt durch andere KI-Ansätze, einen kleinmolekularen Inhibitor der Cyclin-abhängigen Kinase 20 (CDK20) zu identifizieren, allerdings mit einer bescheidenen Affinität von 8,9 μM (Lit. 105). Ein allgemeineres Benchmarking der Leistung von AlphaFold2-Modellen beim virtuellen Screening liefert jedoch gemischte Ergebnisse. In einem Benchmark, der sich auf Ziele mit vorhandenen Kristallstrukturen konzentrierte, mussten die meisten AlphaFold2-Modelle von Schleifen befreit werden, die die Bindungstasche blockieren, und/oder mit bekannten Ionen oder anderen Cofaktoren angereichert werden, um eine angemessene Trefferanreicherung zu erreichen106. Für die praktischeren Fälle von Zielen ohne experimentelle Strukturen, insbesondere für Zielklassen mit weniger offensichtlichen Strukturhomologien in der Ligandenbindungstasche, zeigte die Leistung von AlphaFold2-Modellen beim Andocken kleiner Moleküle in jüngsten Bewertungen für GPCR- und antibakterielle Ziele enttäuschende Ergebnisse107,108 . Der kürzlich entwickelte AphaFill-Ansatz109 zum „Transplantieren“ kleiner Molekül-Cofaktoren und Liganden aus PDB-Strukturen in homologe AlphaFold2-Modelle kann möglicherweise zur Validierung und Optimierung dieser Modelle beitragen, obwohl eine weitere Bewertung ihrer Nützlichkeit für das Andocken und virtuelle Screening im Gange ist.

Um das virtuelle Screening sehr großer chemischer Bibliotheken zu beschleunigen, haben mehrere Gruppen hybride iterative Ansätze vorgeschlagen, bei denen Ergebnisse des strukturbasierten Andockens einer spärlichen Bibliotheksteilmenge zum Trainieren von ML-Modellen verwendet werden, die dann zum Filtern der gesamten Bibliothek verwendet werden seine Größe weiter reduzieren. Diese Methoden, darunter MolPal25, Active Learning110 und DeepDocking111, berichten von einer Reduzierung des Rechenaufwands für Bibliotheken mit 1,4 Milliarden Verbindungen um das 14–100-fache, obwohl nicht klar ist, wie sie sich auf schnell wachsende chemische Räume skalieren lassen.

Wir sollten hier betonen, dass Bewertungsfunktionen in Fast-Docking-Algorithmen und ML-Modellen in erster Linie darauf ausgelegt und trainiert sind, potenzielle Zielbinder effektiv von Nichtbindern zu trennen, obwohl sie bei der Vorhersage von Bindungsaffinitäten oder -stärken nicht sehr genau sind. Für genauere Wirksamkeitsvorhersagen kann die kleinere fokussierte Bibliothek von Kandidatenbindemitteln, die durch das anfängliche KI- oder Docking-basierte Screening ausgewählt wurden, weiter analysiert und mithilfe ausgefeilterer physikbasierter Tools eingestuft werden, einschließlich Methoden zur Störung der freien Energie für relative112 und absolute113,114,115 freie Energie der Ligandenbindung. Obwohl diese Methoden viel langsamer sind, birgt die Nutzung GPU-beschleunigter Berechnungen28 das Potenzial für ihre breitere Anwendung bei der Nachbearbeitung in virtuellen Screening-Kampagnen, um die Trefferquoten für Kandidaten mit hoher Affinität weiter zu erhöhen (Abb. 2), sowie bei der Lead-Optimierung Stufen.

Das Aufkommen schneller und praktischer Methoden zur Durchmusterung chemischer Räume im Gigamaßstab für die Arzneimittelforschung stimuliert das weitere Wachstum dieser On-Demand-Räume und unterstützt eine bessere Vielfalt und die Gesamtqualität der identifizierten Treffer und Hinweise. Die speziell für das V-SYNTHES-Screening entwickelte xREAL-Erweiterung von Enamine REAL Space umfasst jetzt 173 Milliarden Verbindungen116 und kann durch den Zugriff auf einen noch größeren Bausteinsatz (z. B. auf 680 Millionen MADE-Gebäude) auf 1015 Verbindungen und mehr erweitert werden Blöcke47), durch Einbeziehung von Gerüsten mit vier oder fünf Komponenten und durch die Verwendung neuer Klick-ähnlicher Chemien, sobald sie entdeckt werden. Praxisnahe Tests des durch MADE erweiterten REAL Space und anderer kommerzieller und proprietärer Chemieräume werden eine umfassendere Bewertung ihrer Synthesefähigkeit und ihres Gesamtnutzens ermöglichen38,117,118. Parallel dazu können spezialisierte, sehr große Bibliotheken für wichtige Gerüste aufgebaut werden, die in Allzweck-On-Demand-Räumen unterrepräsentiert sind. Beispielsweise ergab das Screening einer virtuellen Bibliothek von 75 Millionen leicht synthetisierbaren Tetrahydropyridinen kürzlich wirksame Agonisten für den 5-HT2A-Rezeptor119.

Das weitere Wachstum der Größe und Vielfalt des bedarfsgesteuerten chemischen Raums wird auch durch die jüngste Entwicklung neuer robuster Reaktionen für die klickartige Anordnung von Bausteinen unterstützt. Neben der „klassischen“ Azid-Alkin-Cycloaddition-Klick-Chemie120, die mit dem Nobelpreis für Chemie 2022121 ausgezeichnet wurde, und optimierten Klick-ähnlichen Reaktionen, einschließlich SuFEx122, sind neuere Entwicklungen wie die Ni-elektrokatalysierte doppelt decarboxylierende Kreuzkupplung123 vielversprechend. Andere Kohlenstoff-Kohlenstoff-bildende Reaktionen nutzen Methyliminodiessigsäureboronate für Csp2-Csp2-Kupplungen124 und seit neuestem auch Tetramethyl-N-methyliminodiessigsäureboronate125 für die stereospezifische Bildung von Csp3-C-Bindungen. Jede dieser Reaktionen kann iterativ angewendet werden und bei Bedarf neue chemische Räume mit Milliarden unterschiedlicher Verbindungen erzeugen, die mit einer begrenzten Anzahl von Bausteinen arbeiten. Ähnlich wie bei der routinemäßig verwendeten automatischen Zusammenstellung von Aminosäuren in der Peptidsynthese könnten vollautomatische Prozesse mit Robotern durchgeführt werden, die in der Lage sind, bei Bedarf eine Bibliothek arzneimittelähnlicher Verbindungen unter Verwendung von Kombinationen aus einigen tausend verschiedenen Bausteinen zu erstellen126,127,128. Solche Maschinen funktionieren bereits, obwohl die Ausweitung der Produktion Tausender Spezialbausteine ​​weiterhin ein Engpass darstellt.

Die Entwicklung robusterer generativer chemischer Räume kann auch durch neue rechnerische Ansätze in der synthetischen Chemie unterstützt werden, beispielsweise Vorhersagen neuer iterativer Reaktionssequenzen129 oder Syntheserouten und Durchführbarkeit aus DL-basierter retrosynthetischer Analyse130. In generativen Modellen können Synthesefähigkeitsvorhersagen mit Vorhersagen der Wirksamkeit und anderer Eigenschaften gekoppelt werden, um höhere Ebenen des automatisierten chemischen Designs zu erreichen131. Daher wurden kürzlich generative kontradiktorische Netzwerke in Kombination mit Verstärkungslernen (GAN-RL) verwendet, um die synthetische Durchführbarkeit, Neuheit und biologische Aktivität von Verbindungen vorherzusagen und so den iterativen Zyklus der In-silico-Optimierung, Synthese und Prüfung der Liganden in vitro zu ermöglichen50,132. Bei Anwendung innerhalb einer Reihe gut etablierter Reaktionen und pharmakologisch erforschter Zielklassen liefern diese Ansätze bereits nützliche Treffer und Hinweise, die zu klinischen Kandidaten führen50,132. Das größere Potenzial automatisierter chemischer Designkonzepte und Robotersynthese in der Arzneimittelforschung bleibt jedoch abzuwarten.

Obwohl Blind-Benchmarking und aktuelle Erfolgsgeschichten im Hinblick auf zukünftige Screenings für die wachsende Zahl von Targets den Nutzen moderner Rechenwerkzeuge belegen, gibt es ganze Klassen anspruchsvoller Targets, bei denen die bestehenden In-silico-Screening-Ansätze für sich genommen voraussichtlich nicht sehr gut abschneiden. Zu den schwierigsten Fällen zählen Ziele mit kryptischen oder flachen Taschen, die sich öffnen oder einer erheblichen induzierten Anpassung unterziehen müssen, um den Liganden zu aktivieren, wie es häufig beim Angriff auf allosterische Stellen, beispielsweise in Kinasen oder GPCRs, oder bei Protein-Protein-Wechselwirkungen in Signalwegen der Fall ist .

Obwohl bioinformatische und molekulardynamische Ansätze dabei helfen können, allosterische und kryptische Taschen zu erkennen und zu analysieren,133 reichen Computerwerkzeuge allein oft nicht aus, um die Ligandenentdeckung für solche anspruchsvollen Stellen zu unterstützen. Die kryptischen und flachen Taschen wurden jedoch recht erfolgreich durch fragmentbasierte Ansätze zur Wirkstoffentdeckung bewältigt, die mit einem experimentellen Screening auf die Bindung kleiner Fragmente beginnen. Die ersten Treffer werden mit sehr empfindlichen Methoden wie BIACORE, NMR, Röntgen134,135 und möglicherweise Kryo-Elektronenmikroskopie136 gefunden, um schwache Bindungen, normalerweise im Bereich von 10–100 μM, zuverlässig nachzuweisen. Das anfängliche Screening des Ziels kann auch mit Fragmenten durchgeführt werden, die mit einem chemischen Sprengkopf dekoriert sind, der eine proximity-gesteuerte kovalente Bindung eines Liganden mit niedriger Affinität ermöglicht137. In beiden Fällen ist die Ausarbeitung der anfänglichen Fragmenttreffer zu vollständigen hochaffinen Liganden der größte Engpass bei der fragmentbasierten Arzneimittelentwicklung, die einen großen Aufwand erfordert, bei dem das Fragment „gezüchtet“ wird oder zwei oder mehr Fragmente miteinander verknüpft werden. Dabei handelt es sich in der Regel um einen iterativen Prozess mit individuellem Ligandendesign und -synthese, der viele Jahre dauern kann134,138. Gleichzeitig kann ein strukturbasiertes virtuelles Screening dabei helfen, die Fragmente rechnerisch so zu bearbeiten, dass sie mit der experimentell identifizierten Konformation der Zielbindungstasche übereinstimmen. Am kostengünstigsten kann dieser Ansatz angewendet werden, wenn Fragmenttreffer anhand der On-Demand-Space-Bausteine ​​oder ihrer nahen Analoga identifiziert werden, um eine einfache Ausarbeitung im selben On-Demand-Space zu ermöglichen139.

Die jüngsten Beispiele hybridfragmentbasierter rechnergestützter Designansätze, die auf SARS-CoV-2-Inhibitoren abzielen, verdeutlichen die Herausforderungen, die solche Ziele mit sich bringen, und ermöglichen direkte Vergleiche mit extrem großen VLS. Eine der Studien zielte auf das konservierte Makrodomänenenzym (Mac1) von SARS-CoV-2 NSP3 ab, das ein entscheidendes Ziel für die Pathogenese und Letalität des Virus darstellt. Aufbauend auf dem kristallographischen Nachweis der Fragmente mit niedriger Affinität (180 μM), die Mac1 schwach binden (Lit. 139), wurde durch die Zusammenführung der Fragmente ein 1 μM-Hit identifiziert, der durch Katalogsynthese schnell zu einem 0,4 μM-Leit optimiert wurde140. In derselben Studie identifizierte ein groß angelegtes Screening von 400 Millionen REAL-Datenbanken mehr als 100 neue, vielfältige Chemotypen arzneimittelähnlicher Liganden, wobei eine anschließende SAR-nach-Katalog-Optimierung einen Vorsprung von 1,7 μM ergab140. Für die SARS-CoV-2-Hauptprotease Mpro veröffentlichte die COVID Moonshot-Initiative Ergebnisse eines kristallographischen Screenings von 1.500 kleinen Fragmenten mit 71 Treffern, die in verschiedenen Untertaschen des flachen aktiven Zentrums gebunden waren, obwohl keines davon selbst bei 100 eine In-vitro-Hemmung der Protease zeigte μM (Ref. 141). Zahlreiche Gruppen, die das anschließende rechnerische Design und Screening verschmolzener und wachsender Fragmente per Crowdsourcing durchführten, trugen zur Entdeckung mehrerer SAR-Serien bei, darunter ein nichtkovalenter Mpro-Inhibitor mit einem enzymatischen IC50 von 21 μM. Die weitere Optimierung sowohl durch strukturbasierte als auch KI-gesteuerte Berechnungsansätze, bei denen mehr als 10 Millionen MADE Enamine-Bausteine ​​verwendet wurden, führte zur Entdeckung präklinischer Kandidaten mit zellbasiertem IC50 im Bereich von etwa 100 nM, was der Wirksamkeit von Nirmatrelvir65 nahekommt . Der enorme Umfang, die Dringlichkeit und die Komplexität dieses Moonshot-Projekts mit mehr als 2.400 Verbindungen, die bei Bedarf synthetisiert und in mehr als 10.000 Tests gemessen werden, sind beispiellos und verdeutlichen die Herausforderungen des De-novo-Designs nichtkovalenter Inhibitoren von Mpro.

Über die Moonshot-Initiative hinaus führte eine Flut virtueller Screening-Bemühungen größtenteils zu enttäuschenden Ergebnissen62, beispielsweise scheiterte das Malariamedikament Ebselen, das in einem frühen virtuellen Screening142 vorgeschlagen wurde, in klinischen Studien. Die meisten dieser Studien untersuchten jedoch kleine Ligandensätze, die sich auf die Umnutzung vorhandener Arzneimittel konzentrierten, es fehlte an experimenteller Unterstützung und sie verwendeten die erste Struktur von Mpro, gelöst in einem kovalenten Ligandenkomplex (PDB-ID: 6LU7), der für das Andocken nichtkovalenter Moleküle nicht optimal war142.

Im Vergleich dazu konnten in mehreren Studien, die sehr große Bibliotheken untersuchten, nicht-kovalente Mpro-Inhibitoren de novo im Bereich von 10–100 μM identifiziert werden24,62,63,143, während experimentell nur einige hundert synthetisierte On-Demand-Verbindungen getestet wurden. Eine dieser Studien ging weiter auf diese schwachen VLS-Treffer ein, indem sie ihre Enamin-Analoga auf Abruf testete, in zellbasierten Tests eine Leitstruktur mit IC50 = 1 μM aufdeckte und ihre nichtkovalente Bindung kristallographisch validierte63. Eine andere Studie, die auf einer späteren, geeigneteren nichtkovalenten Cokristallstruktur von Mpro (PDB-ID: 6W63) basierte, nutzte eine ultragroße Docking- und Optimierungsstrategie, um noch wirksamere 38-nM-Leitverbindungen zu entdecken64. Beachten Sie, dass die Ergebnisse der ersten ultragroßen Screenings für Mpro zwar bescheiden ausfielen, aber mit den viel aufwändigeren und teureren Bemühungen des Moonshot-Hybridansatzes vergleichbar waren, wobei eine einfache On-Demand-Optimierung zu präklinischen Kandidaten ähnlicher Qualität führte. Diese Beispiele legen nahe, dass strukturbasiertes virtuelles Screening selbst für schwierige flache Taschen häufig eine praktikable Alternative darstellen kann, wenn es im Gigamaßstab durchgeführt wird und durch genaue Strukturen sowie ausreichenden Test- und Optimierungsaufwand unterstützt wird.

Trotz aller Herausforderungen und Vorbehalte macht die neu entstehende Fähigkeit von In-silico-Tools, die enorme Fülle und Vielfalt arzneimittelähnlicher chemischer Räume auf Abruf in den Schlüsselstadien vom Ziel über den Treffer bis zum Lead bis zur Klinik effektiv zu erschließen, den Unterschied Es ist verlockend, eine Transformation des DDD-Ökosystems von computergestützt zu computergesteuert zu fordern144 (Abb. 4). In der frühen Treffererkennungsphase werden die ultragroßen virtuellen Screening-Ansätze, sowohl strukturbasiert als auch KI-basiert, zum Mainstream, um schnelle und kostengünstige Einstiegspunkte in Kampagnen zur Arzneimittelentwicklung zu bieten. In der Hit-to-Lead-Phase leiten ausgefeiltere Potenzvorhersagetools wie die Störung der freien Energie und KI-basiertes QSAR oft die rationale Optimierung der Ligandenpotenz. Über die zielgerichtete Wirksamkeit und Selektivität hinaus werden verschiedene datengesteuerte Berechnungstools routinemäßig bei der Multiparameteroptimierung der Leitreihe verwendet, die ADMET- und PK-Eigenschaften umfasst. Bemerkenswert ist, dass chemische Räume von mehr als 1010 verschiedenen Verbindungen wahrscheinlich Millionen von Ersttreffern für jedes Ziel enthalten20 (Kasten 1), Tausende von wirksamen und selektiven Leitmolekülen und, mit einer begrenzten Menge an medizinischer Chemie im selben gut handhabbaren chemischen Raum, Arzneimittelkandidaten bereit für präklinische Studien. Um dieses Potenzial zu nutzen, müssen die Rechenwerkzeuge robuster und besser in die gesamte Forschungspipeline integriert werden, um ihre Wirkung bei der Umsetzung erster Ergebnisse in die präklinische und klinische Entwicklung sicherzustellen.

Schematischer Vergleich der standardmäßigen HTS plus benutzerdefinierter synthesegesteuerter Discovery-Pipeline mit der rechnergesteuerten Pipeline. Letzteres basiert auf leicht zugänglichen On-Demand- oder generativen virtuellen chemischen Räumen sowie strukturbasierten und KI-basierten Rechenwerkzeugen, die jeden Schritt des Arzneimittelentwicklungsprozesses rationalisieren.

Man sollte hier nicht vergessen, dass Berechnungsmodelle, so nützlich oder genau sie auch sein mögen, niemals sicherstellen können, dass alle Vorhersagen korrekt sind. In der Praxis führen die besten virtuellen Screening-Kampagnen dazu, dass 10–40 % der Kandidatentreffer in der experimentellen Validierung bestätigt werden, wohingegen die besten Affinitätsvorhersagen, die bei der Optimierung verwendet werden, selten eine Genauigkeit von mehr als 1 kcal mol−1 quadratischem Mittelfehler aufweisen. Ähnliche Einschränkungen gelten für aktuelle Rechenmodelle zur Vorhersage von ADMET- und PK-Eigenschaften. Daher erfordern rechnerische Vorhersagen bei jedem Schritt der Pipeline immer eine experimentelle Validierung in robusten In-vitro- und In-vivo-Assays. Gleichzeitig liefert das experimentelle Testen von Vorhersagen auch Daten, die durch die Erweiterung ihrer Trainingsdatensätze zur Verbesserung der Qualität der Modelle beitragen können, insbesondere für die Vorhersagen der Ligandeneigenschaften. Daher werden die DL-basierten QSPR-Modelle stark von der weiteren Datenakkumulation in Zellpermeabilitätstests wie CACO-2 und MDCK sowie von neuen fortschrittlichen Technologien wie Organs-on-a-Chip oder funktionellen Organoiden profitieren, um bessere Schätzungen zu ermöglichen von ADMET- und PK-Eigenschaften ohne umständliche In-vivo-Experimente. Die Fähigkeit, ADMET- und PK-Modelle mit In-vitro-Assay-Daten zu trainieren, die die für die Arzneimittelentwicklung relevantesten Spezies (typischerweise Maus, Ratte und Mensch) repräsentieren, würde auch dazu beitragen, die Speziesvariabilität als eine große Herausforderung für erfolgreiche translationale Studien anzugehen. All dies schafft einen positiven Kreislauf zur Verbesserung von Rechenmodellen bis zu dem Punkt, an dem sie die Verbindungsauswahl für die meisten DDD-Endpunkte vorantreiben können. In Kombination mit genaueren In-vitro-Tests kann dies dazu führen, dass die Anforderungen an Tierversuche sinken und schließlich ganz eliminiert werden (wie kürzlich von der FDA angegeben)145.

Der Aufbau hybrider In-silico-In-vitro-Pipelines mit einfachem Zugang zum enormen Bedarfsraum an Chemikalien in allen Phasen des Gen-zu-Leit-Prozesses kann dazu beitragen, reichlich vorhandene Pools verschiedener Leitverbindungen mit optimaler Wirksamkeit, Selektivität und ADMET- und PK-Eigenschaften zu erzeugen Dies führt zu weniger Kompromissen bei der Multiparameteroptimierung für klinische Kandidaten. Der Betrieb solcher datenreichen, rechnergesteuerten Pipelines erfordert übergreifende Datenverwaltungstools für die Arzneimittelforschung, von denen viele in pharmazeutischen und akademischen DDD-Zentren implementiert werden146,147. Der Aufbau rechnergestützter Pipelines wird auch dazu beitragen, schwache oder fehlende Verbindungen aufzudecken, in denen möglicherweise neue Ansätze und zusätzliche Daten erforderlich sind, um verbesserte Modelle zu generieren, und so dazu beitragen, die verbleibenden Rechenlücken in der DDD-Pipeline zu schließen. Vorausgesetzt, dass diese systematische Integration anhält, hat die computergesteuerte Ligandenentdeckung ein großes Potenzial, die Eintrittsbarrieren für die Generierung von Molekülen für zahlreiche Forschungsrichtungen zu verringern, sei es In-vivo-Sonden für neue und wenig erforschte Ziele148, Polypharmakologie und pluridimensionale Signalübertragung oder Arzneimittelkandidaten für seltene Krankheiten und personalisierte Medizin.

Austin, D. & Hayford, T. Forschung und Entwicklung in der Pharmaindustrie. CBO https://www.cbo.gov/publication/57126 (2021).

Sun, D., Gao, W., Hu, H. & Zhou, S. Warum 90 % der klinischen Arzneimittelentwicklung scheitern und wie man sie verbessern kann? Acta Pharm. Sünde. B 12, 3049–3062 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Bajorath, J. Computergestützte Arzneimittelentdeckung. F1000Res. 4, F1000 Faculty Rev-1630 (2015).

Artikel Google Scholar

Van Drie, JH Computergestütztes Arzneimitteldesign: die nächsten 20 Jahre. J. Comput. Unterstützt Mol. Des. 21, 591–601 (2007).

Artikel ADS CAS PubMed Google Scholar

Talele, TT, Khedkar, SA & Rigby, AC Erfolgreiche Anwendungen der computergestützten Arzneimittelforschung: Medikamente vom Konzept in die Klinik bringen. Curr. Spitze. Med. Chem. 10, 127–141 (2010).

Artikel CAS PubMed Google Scholar

Macalino, SJY, Gosu, V., Hong, S. & Choi, S. Rolle des computergestützten Arzneimitteldesigns in der modernen Arzneimittelentwicklung. Bogen. Pharmazeutisch. Res. 38, 1686–1701 (2015).

Artikel CAS Google Scholar

Sabe, VT et al. Aktuelle Trends im computergestützten Arzneimitteldesign und ein Highlight der mithilfe von Computertechniken entdeckten Arzneimittel: ein Rückblick. EUR. J. Med. Chem. 224, 113705 (2021).

Artikel CAS PubMed Google Scholar

Jayatunga, MK, Xie, W., Ruder, L., Schulze, U. & Meier, C. KI in der Entdeckung niedermolekularer Arzneimittel: eine kommende Welle. Nat. Rev. Drug Discov. 21, 175–176 (2022).

Artikel CAS PubMed Google Scholar

Zhavoronkov, A. et al. Deep Learning ermöglicht die schnelle Identifizierung wirksamer DDR1-Kinase-Inhibitoren. Nat. Biotechnologie. 37, 1038–1040 (2019). In dieser Studie wird behauptet, dass ein Hauptkandidat in nur 21 Tagen mithilfe generativer KI, Synthese sowie In-vitro- und In-vivo-Tests der Verbindungen entdeckt wurde.

Artikel CAS PubMed Google Scholar

US-amerikanische Nationalbibliothek für Medizin. ClinicalTrials.gov https://clinicaltrials.gov/ct2/show/NCT05154240#contactlocation (2022).

Schrödinger. Schrödinger gibt die FDA-Freigabe für den Zulassungsantrag für ein neues Prüfpräparat für SGR-1505, einen MALT1-Inhibitor, bekannt. Schrödinger https://ir.schrodinger.com/node/8621/pdf (2022). In dieser Pressemitteilung heißt es, dass kombinierte physikbasierte und ML-Methoden ein rechnerisches Screening von 8,2 Milliarden Verbindungen und die Auswahl eines klinischen Kandidaten nach 10 Monaten und nur 78 synthetisierten Molekülen ermöglichten.

Jones, N. Kristallographie: Atomgeheimnisse. Natur 505, 602–603 (2014).

Artikel ADS CAS PubMed Google Scholar

Liu, W. et al. Serielle Femtosekundenkristallographie von G-Protein-gekoppelten Rezeptoren. Wissenschaft 342, 1521–1524 (2013).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Nannenga, BL & Gonen, T. Die Kryo-EM-Methode der mikrokristallinen Elektronenbeugung (MicroED). Nat. Methoden 16, 369–379 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Fernandez-Leiro, R. & Scheres, SH Entschlüsselung biologischer Makromoleküle mit Kryo-Elektronenmikroskopie. Natur 537, 339–346 (2016).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Renaud, J.-P. et al. Kryo-EM in der Arzneimittelforschung: Erfolge, Grenzen und Perspektiven. Nat. Rev. Drug Discov. 17, 471–492 (2018).

Artikel CAS PubMed Google Scholar

Congreve, M., de Graaf, C., Swain, NA & Tate, CG Einfluss von GPCR-Strukturen auf die Arzneimittelentwicklung. Zelle 181, 81–91 (2020).

Artikel CAS PubMed Google Scholar

Santos, R. et al. Eine umfassende Karte molekularer Wirkstoffziele. Nat. Rev. Drug Discov. 16, 19–34 (2017).

Artikel CAS PubMed Google Scholar

Grygorenko, OO et al. Generierung eines milliardenschweren chemischen Raums leicht zugänglicher Screening-Verbindungen. iScience 23, 101681 (2020).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Lyu, J. et al. Ultragroßes Bibliotheks-Docking zur Entdeckung neuer Chemotypen. Natur 566, 224–229 (2019). Diese ultragroße Docking-Studie untersuchte auch sorgfältig die Vorteile und potenziellen Fallstricke der Erweiterung des Chemieraums.

Artikel ADS CAS PubMed PubMed Central Google Scholar

Stein, RM et al. Virtuelle Entdeckung von Melatoninrezeptorliganden zur Modulation des zirkadianen Rhythmus. Natur 579, 609–614 (2020). Diese Studie zeigt ultragroßes Andocken, das zu subnanomolaren Treffern für einen GPCR führte.

Artikel ADS CAS PubMed PubMed Central Google Scholar

Alon, A. et al. Strukturen des Sigma2-Rezeptors ermöglichen das Andocken zur Entdeckung bioaktiver Liganden. Natur 600, 759–764 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Gorgulla, C. et al. Eine Open-Source-Plattform zur Arzneimittelforschung ermöglicht extrem große virtuelle Bildschirme. Natur 580, 663–668 (2020). Diese Studie zeigt eine iterative Bibliotheksfilterung als ersten Ansatz zur Beschleunigung ultragroßer virtueller Screenings.

Artikel ADS CAS PubMed PubMed Central Google Scholar

Gorgulla, C. et al. Ein mehrgleisiger Ansatz zur gezielten Bekämpfung von SARS-CoV-2-Proteinen mithilfe eines ultragroßen virtuellen Screenings. iScience 24, 102021 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Graff, DE, Shakhnovich, EI & Coley, CW Beschleunigung des virtuellen Hochdurchsatz-Screenings durch molekularpoolbasiertes aktives Lernen. Chem. Wissenschaft. 12, 7866–7881 (2021). Diese Studie führt die Beschleunigung des Ultra-Large-Screenings durch die iterative Kombination von DL und Docking ein.

Artikel CAS PubMed PubMed Central Google Scholar

Sadybekov, AA et al. Synthon-basierte Ligandenentdeckung in virtuellen Bibliotheken von über 11 Milliarden Verbindungen. Natur 601, 452–459 (2022). Diese Studie stellt das modulare Konzept zum Screening von Gigascale-Räumen, V-SYNTHES, vor und validiert seine Leistung bei GPCR- und Kinase-Targets.

Artikel ADS CAS PubMed Google Scholar

Yang, X., Wang, Y., Byrne, R., Schneider, G. & Yang, S. Konzepte künstlicher Intelligenz für die computergestützte Arzneimittelentwicklung. Chem. Rev. 119, 10520–10594 (2019).

Artikel CAS PubMed Google Scholar

Pandey, M. et al. Die transformative Rolle von GPU-Computing und Deep Learning in der Arzneimittelforschung. Nat. Mach. Intel. 4, 211–221 (2022).

Artikel Google Scholar

Blay, V., Tolani, B., Ho, SP & Arkin, MR Hochdurchsatz-Screening: heutige biochemische und zellbasierte Ansätze. Arzneimittelentdeckung. Heute 25, 1807–1821 (2020).

Artikel CAS PubMed Google Scholar

Bohacek, RS, McMartin, C. & Guida, WC Die Kunst und Praxis des strukturbasierten Arzneimitteldesigns: eine molekulare Modellierungsperspektive. Med. Res. Rev. 16, 3–50 (1996).

3.0.CO;2-6" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291098-1128%28199601%2916%3A1%3C3%3A%3AAID-MED1%3E3.0.CO%3B2-6" aria-label="Article reference 30" data-doi="10.1002/(SICI)1098-1128(199601)16:13.0.CO;2-6">Artikel CAS PubMed Google Scholar

Lyu, J., Irwin, JJ & Shoichet, BK Modellierung der Erweiterung virtueller Screening-Bibliotheken. Nat. Chem. Biol. https://doi.org/10.1038/s41589-022-01234-w (2023).

Artikel PubMed Google Scholar

Tomberg, A. & Boström, J. Kann einfache Chemie komplexe, vielfältige und neuartige Moleküle herstellen? Arzneimittelentdeckung. Heute 25, 2174–2181 (2020).

Artikel CAS PubMed Google Scholar

Muchiri, RN & van Breemen, RB Affinitätsselektion – Massenspektrometrie zur Entdeckung pharmakologisch aktiver Verbindungen aus kombinatorischen Bibliotheken und Naturprodukten. J. Massenspektrometer. 56, e4647 (2021).

Artikel ADS CAS PubMed Google Scholar

Fitzgerald, PR & Paegel, BM DNA-kodierte Chemie: Wirkstoffentdeckung aus wenigen guten Reaktionen. Chem. Rev. 121, 7155–7177 (2021).

Artikel CAS PubMed Google Scholar

Neri, D. & Lerner, RA DNA-kodierte chemische Bibliotheken: ein Auswahlsystem, das darauf basiert, organische Verbindungen mit amplifizierbaren Informationen auszustatten. Annu. Rev. Biochem. 87, 479–502 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

McCloskey, K. et al. Maschinelles Lernen in DNA-kodierten Bibliotheken: ein neues Paradigma für die Treffersuche. J. Med. Chem. 63, 8857–8866 (2020).

Artikel CAS PubMed Google Scholar

Walters, WP Virtuelle chemische Bibliotheken. J. Med. Chem. 62, 1116–1124 (2019).

Artikel CAS PubMed Google Scholar

Warr, WA, Nicklaus, MC, Nicolaou, CA und Rarey, M. Erkundung extrem großer Substanzsammlungen für die Arzneimittelentwicklung. J. Chem. Inf. Modell. 62, 2021–2034 (2022). Dies ist ein umfassender Überblick über die Geschichte und die jüngsten Entwicklungen im Bereich der On-Demand- und generativen Chemie.

Artikel CAS PubMed Google Scholar

Enamin. ECHTE Datenbank. Enamine https://enamine.net/compound-collections/real-compounds/real-database (2020).

Hartenfeller, M. et al. Eine Sammlung robuster organischer Synthesereaktionen für das In-silico-Moleküldesign. J. Chem. Inf. Modell. 51, 3093–3098 (2011).

Artikel CAS PubMed Google Scholar

Patel, H. et al. SAVI, In-silico-Generierung von Milliarden leicht synthetisierbarer Verbindungen durch Regeln vom Typ Expertensystem. Wissenschaft. Daten 7, 384 (2020).

Artikel PubMed PubMed Central Google Scholar

Irwin, JJ et al. ZINC20 – Eine kostenlose chemische Datenbank im Ultragroßmaßstab für die Ligandenentdeckung. J. Chem. Inf. Modell. 60, 6065–6073 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Hu, Q. et al. Pfizer Global Virtual Library (PGVL): ein Chemie-Design-Tool, das auf experimentell validierten Informationen zur Parallelsynthese basiert. ACS-Kamm. Wissenschaft. 14, 579–589 (2012).

Artikel CAS PubMed Google Scholar

Nicolaou, CA, Watson, IA, Hu, H. & Wang, J. Die Proximal Lilly Collection: Kartierung, Erforschung und Nutzung möglicher chemischer Räume. J. Chem. Inf. Modell. 56, 1253–1266 (2016).

Artikel CAS PubMed Google Scholar

Enamin. ECHTER Raum. Enamin https://enamine.net/library-synthesize/real-compounds/real-space-navigator (2022).

Bellmann, L., Penner, P., Gastreich, M. & Rarey, M. Vergleich kombinatorischer Fragmenträume und ihre Anwendung auf ultragroße Make-on-Demand-Verbindungskataloge. J. Chem. Inf. Modell. 62, 553–566 (2022).

Artikel CAS PubMed Google Scholar

Enamin. Erstellen Sie Bausteine ​​nach Bedarf (MADE). Enamine https://enamine.net/building-blocks/made-building-blocks (2022).

Hoffmann, T. & Gastreich, M. Die nächste Stufe der chemischen Raumnavigation: weit über aufzählbare Verbindungsbibliotheken hinausgehen. Arzneimittelentdeckung. Heute 24, 1148–1156 (2019).

Artikel CAS PubMed Google Scholar

Ruddigkeit, L., van Deursen, R., Blum, LC & Reymond, J.-L. Aufzählung von 166 Milliarden organischen kleinen Molekülen in der chemischen Universumsdatenbank GDB-17. J. Chem. Inf. Modell. 52, 2864–2875 (2012).

Artikel CAS PubMed Google Scholar

Vanhaelen, Q., Lin, Y.-C. & Zhavoronkov, A. Das Aufkommen der generativen Chemie. ACS Med. Chem. Lette. 11, 1496–1505 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Ballante, F., Kooistra, AJ, Kampen, S., de Graaf, C. & Carlsson, J. Strukturbasiertes virtuelles Screening für Liganden von G-Protein-gekoppelten Rezeptoren: Was kann molekulares Docking für Sie tun? Pharmakol. Rev. 73, 527–565 (2021).

Artikel PubMed Google Scholar

Neves, MA, Totrov, M. & Abagyan, R. Andocken und Scoring mit ICM: die Benchmarking-Ergebnisse und Strategien zur Verbesserung. J. Comput. Unterstützt Mol. Des. 26, 675–686 (2012).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Meiler, J. & Baker, D. ROSETTALIGAND: Protein-Kleinmolekül-Andocken mit voller Seitenkettenflexibilität. Proteine ​​65, 538–548 (2006).

Artikel CAS PubMed Google Scholar

Lorber, DM & Shoichet, BK Flexibles Andocken von Liganden mithilfe von Konformationsensembles. Proteinwissenschaft. 7, 938–950 (1998).

Artikel CAS PubMed PubMed Central Google Scholar

Trott, O. & Olson, AJ AutoDock Vina: Verbesserung der Geschwindigkeit und Genauigkeit des Andockens mit einer neuen Bewertungsfunktion, effizienter Optimierung und Multithreading. J. Comput. Chem. 31, 455–461 (2010).

CAS PubMed PubMed Central Google Scholar

Halgren, TA et al. Glide: ein neuer Ansatz für schnelles, präzises Andocken und Scoring. 2. Anreicherungsfaktoren beim Datenbank-Screening. J. Med. Chem. 47, 1750–1759 (2004).

Artikel CAS PubMed Google Scholar

Friesner, RA et al. Glide: ein neuer Ansatz für schnelles, präzises Andocken und Scoring. 1. Methode und Bewertung der Andockgenauigkeit. J. Med. Chem. 47, 1739–1749 (2004).

Artikel CAS PubMed Google Scholar

Gaieb, Z. et al. Große D3R-Herausforderung 3: Blinde Vorhersage von Protein-Liganden-Positionen und Affinitätsrankings. J. Comput. Unterstützt Mol. Des. 33, 1–18 (2019).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Parks, CD et al. Große D3R-Herausforderung 4: Blindvorhersage von Protein-Ligand-Positionen, Affinitätsrankings und relativen freien Bindungsenergien. J. Comput. Unterstützt Mol. Des. 34, 99–119 (2020).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Bender, BJ et al. Eine praktische Anleitung zum groß angelegten Andocken. Nat. Protokoll. 16, 4799–4832 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Manglik, A. et al. Strukturbasierte Entdeckung von Opioid-Analgetika mit reduzierten Nebenwirkungen. Natur 537, 185–190 (2016).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Cerón-Carrasco, JP Wenn virtuelles Screening inaktive Medikamente liefert: Umgang mit falschen theoretischen Freunden. ChemMedChem 17, e202200278 (2022).

PubMed PubMed Central Google Scholar

Rossetti, GG et al. Nichtkovalente SARS-CoV-2-Mpro-Inhibitoren wurden aus In-silico-Screening-Treffern entwickelt. Wissenschaft. Rep. 12, 2505 (2022).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Luttens, A. et al. Ultragroßes virtuelles Screening identifiziert die wichtigsten Proteaseinhibitoren von SARS-CoV-2 mit Breitbandaktivität gegen Coronaviren. Marmelade. Chem. Soc. 144, 2905–2920 (2022). Diese Studie vergleicht die fragmentbasierte und ultragroße Screening-basierte Entdeckung von Leitkandidaten für das anspruchsvolle Ziel.

Artikel CAS PubMed PubMed Central Google Scholar

Owen, DR et al. Ein klinischer Kandidat für einen oralen SARS-CoV-2-Mpro-Inhibitor zur Behandlung von COVID-19. Wissenschaft 374, 1586–1593 (2021).

Artikel ADS CAS PubMed Google Scholar

Böhm, H.-J. Das Computerprogramm LUDI: eine neue Methode zum De-novo-Design von Enzyminhibitoren. J. Comput. Unterstützt Mol. Des. 6, 61–78 (1992).

Artikel ADS PubMed Google Scholar

Beroza, P. et al. Das Andocken im chemischen Raum ermöglicht ein groß angelegtes strukturbasiertes virtuelles Screening zur Entdeckung von ROCK1-Kinase-Inhibitoren. Nat. Komm. 13, 6447 (2022).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Jumper, J. et al. Anwenden und Verbessern von AlphaFold bei CASP14. Proteine ​​89, 1711–1721 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Vamathevan, J. et al. Anwendungen des maschinellen Lernens in der Arzneimittelforschung und -entwicklung. Nat. Rev. Drug Discov. 18, 463–477 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Schneider, P. et al. Überdenken des Medikamentendesigns im Zeitalter der künstlichen Intelligenz. Nat. Rev. Drug Discov. 19, 353–364 (2020). Dieser Artikel bietet eine umfassende Einführung in DL-Ansätze in der Arzneimittelforschung.

Artikel CAS PubMed Google Scholar

Elbadawi, M., Gaisford, S. & Basit, AW Fortgeschrittene Techniken des maschinellen Lernens in der Arzneimittelforschung. Arzneimittelentdeckung. Heute 26, 769–777 (2021).

Artikel CAS PubMed Google Scholar

Bender, A. & Cortés-Ciriano, I. Künstliche Intelligenz in der Arzneimittelforschung: Was ist realistisch, was sind Illusionen? Teil 1: Möglichkeiten, etwas zu bewirken, und warum wir noch nicht so weit sind. Arzneimittelentdeckung. Heute 26, 511–524 (2021).

Artikel CAS PubMed Google Scholar

Davies, M. et al. Verbesserung der Genauigkeit der vorhergesagten Pharmakokinetik beim Menschen: Lehren aus der Medikamentenpipeline von AstraZeneca über zwei Jahrzehnte. Trends Pharmacol. Wissenschaft. 41, 390–408 (2020).

Artikel CAS PubMed Google Scholar

Schneckener, S. et al. Vorhersage der oralen Bioverfügbarkeit bei Ratten: Übertragung von Erkenntnissen aus In-vitro-Korrelationen auf (tiefe) maschinelle Lernmodelle unter Verwendung von In-silico-Modellergebnissen und chemischen Strukturparametern. J. Chem. Inf. Modell. 59, 4893–4905 (2019).

Artikel CAS PubMed Google Scholar

Cherkasov, A. et al. QSAR-Modellierung: Wo waren Sie? Wohin gehst du? J. Med. Chem. 57, 4977–5010 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Keiser, MJ et al. Vorhersage neuer molekularer Ziele für bekannte Medikamente. Natur 462, 175–181 (2009).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Guney, E., Menche, J., Vidal, M. & Barábasi, A.-L. Netzwerkbasiertes In-Silico-Screening der Arzneimittelwirksamkeit. Nat. Komm. 7, 10331 (2016).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Cichońska, A. et al. Crowdsourcing-Kartierung des unerforschten Zielraums von Kinaseinhibitoren. Nat. Komm. 12, 3307 (2021).

Artikel PubMed PubMed Central Google Scholar

Gaulton, A. et al. ChEMBL: eine groß angelegte Bioaktivitätsdatenbank für die Arzneimittelforschung. Nukleinsäuren Res. 40, D1100–D1107 (2012).

Artikel CAS PubMed Google Scholar

Tang, J. et al. Drug Target Commons: eine Gemeinschaftsinitiative zum Aufbau einer Konsens-Wissensbasis für Arzneimittel-Target-Wechselwirkungen. Zellchemie. Biol. 25, 224–229.e222 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Liu, Z. et al. PDB-weite Sammlung von Bindungsdaten: aktueller Status der PDBbind-Datenbank. Bioinformatik 31, 405–412 (2015).

Artikel CAS PubMed Google Scholar

Gaudelet, T. et al. Einsatz von Graph-Machine-Learning in der Arzneimittelforschung und -entwicklung. Knapp. Bioinform. 22, bbab159 (2021).

Artikel PubMed PubMed Central Google Scholar

Son, J. & Kim, D. Entwicklung eines Graph-Faltungs-Neuronalen Netzwerkmodells zur effizienten Vorhersage von Protein-Ligand-Bindungsaffinitäten. PLoS ONE 16, e0249404 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Stepniewska-Dziubinska, MM, Zielenkiewicz, P. & Siedlecki, P. Verbesserung der Erkennung von Protein-Ligand-Bindungsstellen durch 3D-Segmentierung. Wissenschaft. Rep. 10, 5035 (2020).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Jiménez, J., Škalič, M., Martínez-Rosell, G. & De Fabritiis, G. KDEEP: Vorhersage der absoluten Protein-Ligand-Bindungsaffinität über 3D-Faltungs-Neuronale Netze. J. Chem. Inf. Modell. 58, 287–296 (2018).

Artikel PubMed Google Scholar

Jones, D. et al. Verbesserte Vorhersage der Protein-Ligand-Bindungsaffinität mit strukturbasierter Tiefenfusionsinferenz. J. Chem. Inf. Modell. 61, 1583–1592 (2021).

Artikel CAS PubMed Google Scholar

Volkov, M. et al. Über die Frustration, Bindungsaffinitäten aus Protein-Ligand-Strukturen mit tiefen neuronalen Netzwerken vorherzusagen. J. Med. Chem. 65, 7946–7958 (2022).

Artikel CAS PubMed Google Scholar

Roberts, M. et al. Häufige Fallstricke und Empfehlungen für den Einsatz von maschinellem Lernen zur Erkennung und Prognose von COVID-19 mithilfe von Röntgenaufnahmen des Brustkorbs und CT-Scans. Nat. Mach. Intel. 3, 199–217 (2021).

Artikel Google Scholar

Beker, W. et al. Maschinelles Lernen kann manchmal einfach nur Popularitätstrends in der Literatur erfassen: eine Fallstudie zur heterozyklischen Suzuki-Miyaura-Kopplung. Marmelade. Chem. Soc. 144, 4819–4827 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Yu, B. & Kumbier, K. Veridical Data Science. Proz. Natl Acad. Wissenschaft. USA 117, 3920–3929 (2020). Dieser perspektivische Artikel legt den Grundstein für veridical AI.

Artikel ADS MathSciNet CAS PubMed PubMed Central MATH Google Scholar

Ng, A., Laird, D. & He, L. Datenzentrierter KI-Wettbewerb. DeepLearning AI https://https.deeplearning-ai.github.io/data-centric-comp/ (2021).

Miranda, LJ Auf dem Weg zum datenzentrierten maschinellen Lernen: ein kurzer Rückblick. LJ Miranda https://ljvmiranda921.github.io/notebook/2021/07/30/data-centric-ml/ (2021).

Jiménez-Luna, J., Grisoni, F. & Schneider, G. Arzneimittelentdeckung mit erklärbarer künstlicher Intelligenz. Nat. Mach. Intel. 2, 573–584 (2020).

Artikel Google Scholar

Wills, T. KI-Arzneimittelentwicklung: Bewertung der ersten KI-entwickelten Arzneimittelkandidaten, die in klinische Studien am Menschen gehen. CAS https://www.cas.org/resources/cas-insights/drug-discovery/ai-designed-drug-candidates (2022).

Meng, C., Seo, S., Cao, D., Griesemer, S. & Liu, Y. Wenn Physik auf maschinelles Lernen trifft: eine Übersicht über physikinformiertes maschinelles Lernen. Vorabdruck unter https://doi.org/10.48550/arXiv.2203.16797 (2022).

Thomas, M., Bender, A. & de Graaf, C. Integration strukturbasierter Ansätze in generatives molekulares Design. Curr. Meinung. Struktur. Biol. 79, 102559 (2023).

Artikel CAS PubMed Google Scholar

Ackloo, S. et al. CACHE (Critical Assessment of Computational Hit-finding Experiments): eine öffentlich-private Partnerschafts-Benchmarking-Initiative, die die Entwicklung rechnerischer Methoden zur Trefferfindung ermöglicht. Nat. Rev. Chem. 6, 287–295 (2022). Hierbei handelt es sich um eine wichtige Gemeinschaftsinitiative zur umfassenden Leistungsbewertung rechnergestützter Methoden zur Arzneimittelentdeckung.

Artikel PubMed PubMed Central Google Scholar

MolSoft. Rapid Isostere Discovery Engine (RIDE). MolSoft http://molsoft.com/RIDE.html (2022).

Jumper, J. et al. Hochpräzise Vorhersage der Proteinstruktur mit AlphaFold. Natur 596, 583–589 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Tunyasuvunakool, K. et al. Hochpräzise Vorhersage der Proteinstruktur für das menschliche Proteom. Natur 596, 590–596 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Baek, M. et al. Genaue Vorhersage von Proteinstrukturen und -interaktionen mithilfe eines dreispurigen neuronalen Netzwerks. Wissenschaft 373, 871–876 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Akdel, M. Eine strukturbiologische Community-Bewertung von AlphaFold2-Anwendungen. Nat. Struktur. Mol. Biol. 29, 1056–1067 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Katritch, V., Rueda, M. & Abagyan, R. Ligandengesteuerte Rezeptoroptimierung. Methoden Mol. Biol. 857, 189–205 (2012).

Artikel CAS PubMed Google Scholar

Carlsson, J. et al. Ligandenentdeckung anhand eines Dopamin-D3-Rezeptor-Homologiemodells und einer Kristallstruktur. Nat. Chem. Biol. 7, 769–778 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Ren, F. et al. AlphaFold beschleunigt die auf künstlicher Intelligenz basierende Arzneimittelforschung: effiziente Entdeckung eines neuartigen niedermolekularen Inhibitors der Cyclin-abhängigen Kinase 20 (CDK20). Chem. Wissenschaft. 14, 1443–1452 (2023).

Zhang, Y. et al. Benchmarking verfeinerter und nicht verfeinerter AlphaFold2-Strukturen zur Treffererkennung. J. Chem. Inf. Modell. 63, 1656–1667 (2023).

Er, X.-h. et al. AlphaFold2 versus experimentelle Strukturen: Bewertung an G-Protein-gekoppelten Rezeptoren. Acta Pharmacol. Sünde. 44, 1–7 (2022).

Artikel PubMed Google Scholar

Wong, F. et al. Benchmarking von AlphaFold-fähigen molekularen Docking-Vorhersagen für die Antibiotika-Entdeckung. Mol. Syst. Biol. 18, e11081 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Heckelman, ML, de Vries, I., Joosten, RP & Perrakis, A. AlphaFill: Anreicherung von AlphaFold-Modellen mit Liganden und Cofaktoren. Nat. Methoden 20, 205–213 (2023).

Artikel CAS PubMed Google Scholar

Yang, Y. et al. Effiziente Erkundung des chemischen Raums mit Docking und Deep Learning. J. Chem. Theorieberechnung. 17, 7106–7119 (2021).

Artikel CAS PubMed Google Scholar

Gentile, F. et al. Durch künstliche Intelligenz ermöglichtes virtuelles Screening extrem großer chemischer Bibliotheken mit Deep Docking. Nat. Protokoll. 17, 672–697 (2022).

Artikel CAS PubMed Google Scholar

Schindler, CEM et al. Umfangreiche Bewertung der Berechnungen der freien Bindungsenergie in aktiven Arzneimittelforschungsprojekten. J. Chem. Inf. Modell. 60, 5457–5474 (2020).

Artikel CAS PubMed Google Scholar

Chen, W., Cui, D., Abel, R., Friesner, RA & Wang, L. Genaue Berechnung der absoluten freien Protein-Ligand-Bindungsenergien. Vorabdruck unter https://doi.org/10.26434/chemrxiv-2022-2t0dq-v2 (2022).

Khalak, Y. et al. Alchemistische absolute freie Protein-Ligand-Bindungsenergien für die Arzneimittelentwicklung. Chem. Wissenschaft. 12, 13958–13971 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Cournia, Z. et al. Strenge Freie-Energie-Simulationen im virtuellen Screening. J. Chem. Inf. Modell. 60, 4153–4169 (2020).

Artikel CAS PubMed Google Scholar

xREAL Chemical Space, Chemspace, https://chem-space.com/services#v-synthes (2023).

Rarey, M., Nicklaus, MC & Warr, W. Sonderausgabe zu Reaktionsinformatik und chemischem Raum. J. Chem. Inf. Modell. 62, 2009–2010 (2022).

Artikel CAS PubMed Google Scholar

Zabolotna, Y. et al. Ein genauer Blick auf den chemischen Raum kommerziell erhältlicher Bausteine ​​für die medizinische Chemie. J. Chem. Inf. Modell. 62, 2171–2185 (2022).

Artikel CAS PubMed Google Scholar

Kaplan, AL et al. Maßgeschneidertes Bibliotheks-Docking für 5-HT2A-Rezeptoragonisten mit antidepressiver Wirkung. Natur 610, 582–591 (2022).

Artikel ADS CAS PubMed Google Scholar

Krasiński, A., Fokin, VV & Sharpless, KB Direkte Synthese von 1,5-disubstituierten 4-Magnesio-1,2,3-triazolen, überarbeitet. Org. Lette. 6, 1237–1240 (2004).

Artikel PubMed Google Scholar

Der Nobelpreis für Chemie. nobelprize.org, https://www.nobelprize.org/prizes/chemistry/2022/summary/ (2022)

Dong, J., Sharpless, KB, Kwisnek, L., Oakdale, JS & Fokin, VV SuFEx-basierte Synthese von Polysulfaten. Angew. Chem. Int. Ed. Engl. 53, 9466–9470 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Zhang, B. et al. Ni-elektrokatalytische Csp3-Csp3 doppelt decarboxylierende Kupplung. Natur 606, 313–318 (2022).

Artikel ADS CAS PubMed Google Scholar

Gillis, EP & Burke, MD Iterative Kreuzkupplung mit MIDA-Boronaten: Auf dem Weg zu einer allgemeinen Plattform für die Synthese kleiner Moleküle. Aldrichimica Acta 42, 17–27 (2009).

CAS PubMed PubMed Central Google Scholar

Blair, DJ et al. Automatisierte iterative Csp3-C-Bindungsbildung. Natur 604, 92–97 (2022). Diese Studie bietet einen chemischen Ansatz zur Automatisierung der CC-Bindungsbildung in der Synthese kleiner Moleküle.

Artikel ADS CAS PubMed Google Scholar

Li, J. et al. Synthese vieler verschiedener Arten organischer kleiner Moleküle mithilfe eines automatisierten Prozesses. Wissenschaft 347, 1221–1226 (2015).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Trobe, M. & Burke, MD Die molekulare industrielle Revolution: automatisierte Synthese kleiner Moleküle. Angew. Chem. Int. Ed. 57, 4192–4214 (2018).

Artikel CAS Google Scholar

Bubliauskas, A. et al. Digitalisierung der chemischen Synthese in 3D-gedruckten Reaktionsgefäßen. Angew. Chem. Int. Ed. 61, e202116108 (2022).

Artikel CAS Google Scholar

Molga, K. et al. Ein Computeralgorithmus zur Entdeckung iterativer Abfolgen organischer Reaktionen. Nat. Synth. 1, 49–58 (2022).

Artikel ADS Google Scholar

Segler, MHS, Preuss, M. & Waller, MP Planung chemischer Synthesen mit tiefen neuronalen Netzen und symbolischer KI. Natur 555, 604–610 (2018).

Artikel ADS CAS PubMed Google Scholar

Goldman, B., Kearnes, S., Kramer, T., Riley, P. & Walters, WP Definieren der Ebenen des automatisierten chemischen Designs. J. Med. Chem. 65, 7073–7087 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Grisoni, F. et al. Kombination generativer künstlicher Intelligenz und On-Chip-Synthese für das De-novo-Arzneimitteldesign. Wissenschaft. Adv. 7, eabg3338 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Wagner, JR et al. Neue Computermethoden zur rationalen Entdeckung allosterischer Arzneimittel. Chem. Rev. 116, 6370–6390 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Davis, BJ & Hubbard, RE in Structural Biology in Drug Discovery (Hrsg. Renaud, J.-P.) 79–98 (2020).

de Souza Neto, LR et al. In-silico-Strategien zur Unterstützung der Fragment-zu-Leit-Optimierung in der Arzneimittelforschung. Vorderseite. Chem. 8, 93 (2020).

Artikel ADS PubMed PubMed Central Google Scholar

Saur, M. et al. Fragmentbasierte Arzneimittelentwicklung mittels Kryo-EM. Arzneimittelentdeckung. Heute 25, 485–490 (2020).

Artikel CAS PubMed Google Scholar

Kuljanin, M. et al. Neukonzeption der Hochdurchsatz-Profilierung reaktiver Cysteine ​​für das zellbasierte Screening großer Elektrophilbibliotheken. Nat. Biotechnologie. 39, 630–641 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Muegge, I., Martin, YC, Hajduk, PJ & Fesik, SW Bewertung der PMF-Bewertung beim Andocken schwacher Liganden an das FK506-Bindungsprotein. J. Med. Chem. 42, 2498–2503 (1999).

Artikel CAS PubMed Google Scholar

Schuller, M. et al. Fragmentbindung an die Nsp3-Makrodomäne von SARS-CoV-2, identifiziert durch kristallographisches Screening und rechnergestütztes Docking. Wissenschaft. Adv. 7, eabf8711 (2021).

Artikel ADS PubMed PubMed Central Google Scholar

Gahbauer, S. et al. Iteratives Computerdesign und kristallographisches Screening identifizieren wirksame Inhibitoren, die auf die Nsp3-Makrodomäne von SARS-CoV-2 abzielen. Proz. Natl Acad. Wissenschaft. USA 120, e2212931120 (2023). Dieser Artikel demonstriert die Anwendung sowohl des hybriden Fragment-Screening-and-Merging-Designs als auch des Screenings ultragroßer Bibliotheken auf ein anspruchsvolles virales Ziel.

Artikel CAS PubMed PubMed Central Google Scholar

Achdout, H. et al. Offene wissenschaftliche Entdeckung oraler nicht-kovalenter SARS-CoV-2-Hauptproteaseinhibitor-Therapeutika. Vorabdruck unter https://doi.org/10.1101/2020.10.29.339317 (2022).

Jin, Z. et al. Struktur von Mpro aus SARS-CoV-2 und Entdeckung seiner Inhibitoren. Natur 582, 289–293 (2020).

Artikel ADS CAS PubMed Google Scholar

Ton, AT, Gentile, F., Hsing, M., Ban, F. & Cherkasov, A. Schnelle Identifizierung potenzieller Inhibitoren der SARS-CoV-2-Hauptprotease durch Deep Docking von 1,3 Milliarden Verbindungen. Mol. Informieren. 39, e2000028 (2020).

Artikel PubMed Google Scholar

Frye, L., Bhat, S., Akinsanya, K. & Abel, R. Von der computergestützten Arzneimittelentdeckung zur computergesteuerten Arzneimittelentdeckung. Arzneimittelentdeckung. Heute Technol. 39, 111–117 (2021).

Artikel CAS PubMed Google Scholar

Wadman, M. Die FDA muss vor Arzneimittelversuchen am Menschen keine Tierversuche mehr verlangen. Wissenschaft, https://doi.org/10.1126/science.adg6264 (2023).

Stiefl, N. et al. FOCUS – Entwicklung einer globalen Kommunikations- und Modellierungsplattform für angewandte und computergestützte medizinische Chemiker. J. Chem. Inf. Modell. 55, 896–908 (2015).

Artikel CAS PubMed Google Scholar

Schrödinger. LiveDesign. Schrödinger https://www.schrödinger.com/sites/default/files/general_ld_rgb_080119_forweb.pdf. (abgerufen am 5. April 2023)

Müller, S. et al. Ziel 2035 – Update zur Suche nach einer Sonde für jedes Protein. RSC Med. Chem. 13, 13–21 (2022).

Artikel PubMed Google Scholar

Verdonk, ML, Cole, JC, Hartshorn, MJ, Murray, CW & Taylor, RD Verbessertes Protein-Ligand-Docking mit GOLD. Proteins 52, 609–623 (2003).

Artikel CAS PubMed Google Scholar

Miller, EB et al. Zuverlässige und genaue Lösung des induzierten Fit-Docking-Problems bei der Protein-Ligand-Bindung. J. Chem. Theorieberechnung. 17, 2630–2639 (2021).

Artikel CAS PubMed Google Scholar

Andocken chemischer Räume. BioSolveIT https://www.biosolveit.de/application-academy/chemical-space-docking/ (2022).

Cavasotto, CN in Quantum Mechanics in Drug Discovery (Hrsg. Heifetz, A.) 257–268 (Springer, 2020).

Dixon, SL et al. AutoQSAR: ein automatisiertes maschinelles Lerntool für die quantitative Best-Practice-Modellierung von Struktur-Aktivitäts-Beziehungen. Zukünftiges Med. Chem. 8, 1825–1839 (2016).

Artikel ADS CAS PubMed Google Scholar

Totrov, M. Atomare Eigenschaftsfelder: verallgemeinertes 3D-pharmakophorisches Potenzial für automatisierte Ligandenüberlagerung, Pharmakophor-Aufklärung und 3D-QSAR. Chem. Biol. Drogen Des. 71, 15–27 (2008).

Artikel CAS PubMed Google Scholar

Schaller, D. et al. 3D-Pharmakophormodellierung der nächsten Generation. WIRES Comput. Mol. Wissenschaft. 10, e1468 (2020).

Artikel CAS Google Scholar

Chakravarti, SK & Alla, SRM Deskriptorfreie QSAR-Modellierung unter Verwendung von Deep Learning mit neuronalen Netzen mit langem Kurzzeitgedächtnis. Vorderseite. Artif. Intel. 2, 17 (2019).

Artikel PubMed PubMed Central Google Scholar

Deng, Z., Chuaqui, C. & Singh, J. Struktureller Interaktionsfingerabdruck (SIFT): eine neuartige Methode zur Analyse dreidimensionaler Protein-Ligand-Bindungsinteraktionen. J. Med. Chem. 47, 337–344 (2004).

Artikel CAS PubMed Google Scholar

Referenzen herunterladen

Wir danken A. Brooun, AA Sadybekov, S. Majumdar, MM Babu, Y. Moroz und V. Cherezov für hilfreiche Diskussionen.

Abteilung für quantitative und computergestützte Biologie, University of Southern California, Los Angeles, CA, USA

Anastasiia V. Sadybekov und Vsevolod Katritch

Zentrum für neue Technologien in der Arzneimittelforschung und -entwicklung, Bridge Institute, Michelson Center for Convergent Biosciences, University of Southern California, Los Angeles, CA, USA

Anastasiia V. Sadybekov und Vsevolod Katritch

Fakultät für Chemie, University of Southern California, Los Angeles, CA, USA

Wsewolod Katritsch

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Alle Autoren haben zum Verfassen des Manuskripts beigetragen.

Korrespondenz mit Vsevolod Katritch.

Die University of Southern California beantragt derzeit einen Patentantrag (Nr. 63159888) für die V-SYNTHES-Methode, in dem VK als Miterfinder aufgeführt ist.

Nature dankt Alexander Tropsha und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Springer Nature oder sein Lizenzgeber (z. B. eine Gesellschaft oder ein anderer Partner) besitzen die ausschließlichen Rechte an diesem Artikel im Rahmen einer Veröffentlichungsvereinbarung mit dem Autor bzw. den Autoren oder anderen Rechteinhabern. Die Selbstarchivierung der akzeptierten Manuskriptversion dieses Artikels durch den Autor unterliegt ausschließlich den Bedingungen dieser Veröffentlichungsvereinbarung und geltendem Recht.

Nachdrucke und Genehmigungen

Sadybekov, AV, Katritch, V. Computergestützte Ansätze zur Optimierung der Arzneimittelforschung. Natur 616, 673–685 (2023). https://doi.org/10.1038/s41586-023-05905-z

Zitat herunterladen

Eingegangen: 21. April 2022

Angenommen: 01. März 2023

Veröffentlicht: 26. April 2023

Ausgabedatum: 27. April 2023

DOI: https://doi.org/10.1038/s41586-023-05905-z

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.