DEDTI versus IEDTI: effiziente und prädiktive Arzneimittelmodelle

Nachricht

HeimHeim / Nachricht / DEDTI versus IEDTI: effiziente und prädiktive Arzneimittelmodelle

Oct 24, 2023

DEDTI versus IEDTI: effiziente und prädiktive Arzneimittelmodelle

Wissenschaftliche Berichte Band 13,

Wissenschaftliche Berichte Band 13, Artikelnummer: 9238 (2023) Diesen Artikel zitieren

Details zu den Metriken

Die Wiederverwendung von Arzneimitteln ist ein aktiver Forschungsbereich, der darauf abzielt, die Kosten und den Zeitaufwand für die Arzneimittelentwicklung zu senken. Die meisten dieser Bemühungen befassen sich hauptsächlich mit der Vorhersage von Arzneimittel-Ziel-Wechselwirkungen. Viele Bewertungsmodelle, von der Matrixfaktorisierung bis hin zu modernsten tiefen neuronalen Netzen, sind auf den Plan getreten, solche Beziehungen zu identifizieren. Bei einigen Vorhersagemodellen geht es um die Qualität der Vorhersage, bei anderen um die Effizienz der Vorhersagemodelle, z. B. die Einbettungsgenerierung. In dieser Arbeit schlagen wir neue Darstellungen von Arzneimitteln und Zielen vor, die für weitere Vorhersagen und Analysen nützlich sind. Unter Verwendung dieser Darstellungen schlagen wir zwei induktive Deep-Network-Modelle von IEDTI und DEDTI für die Vorhersage von Arzneimittel-Ziel-Interaktionen vor. Beide nutzen die Anhäufung neuer Darstellungen. Der IEDTI nutzt das Triplett und ordnet die eingegebenen akkumulierten Ähnlichkeitsmerkmale in sinnvolle Einbettungs-entsprechende Vektoren um. Anschließend wird auf jedes Arzneimittel-Ziel-Paar ein tiefgreifendes Vorhersagemodell angewendet, um deren Wechselwirkung zu bewerten. Der DEDTI nutzt direkt die akkumulierten Ähnlichkeitsmerkmalsvektoren von Arzneimitteln und Zielen und wendet ein Vorhersagemodell auf jedes Paar an, um deren Wechselwirkungen zu identifizieren. Wir haben eine umfassende Simulation des DTINet-Datensatzes sowie der Goldstandard-Datensätze durchgeführt und die Ergebnisse zeigen, dass DEDTI IEDTI und die hochmodernen Modelle übertrifft. Darüber hinaus führen wir eine Docking-Studie zu neuen vorhergesagten Wechselwirkungen zwischen zwei Arzneimittel-Ziel-Paaren durch und die Ergebnisse bestätigen eine akzeptable Arzneimittel-Ziel-Bindungsaffinität zwischen beiden vorhergesagten Paaren.

Die Entdeckung von De-novo-Arzneimitteln verschlingt enorme Geldbeträge und erfordert eine langwierige Untersuchung ohne Erfolgsgarantie1. Um diese Herausforderungen zu meistern, werden zunehmend rechnergestützte Methoden zur Arzneimittelentdeckung eingesetzt, um unbekannte und versteckte Arzneimittel-Ziel-Interaktionen (DTIs) zur Behandlung zahlreicher Krankheiten zu identifizieren. Die computergestützte Wiederverwendung von Arzneimitteln ist ein Meilenstein bei der Identifizierung neuer Indikationen für derzeit vermarktete Arzneimittel gegen interessierende Ziele. Die Hauptidee hinter den rechnergestützten Strategien zur Arzneimittelumnutzung basiert auf der Tatsache, dass ähnliche Verbindungen ähnliche Eigenschaften aufweisen können (bekannt als Schuld-durch-Assoziation)2,3. Es gibt drei Hauptansätze für die rechnerische DTI-Vorhersage4. Der ligandenbasierte Ansatz ist der erste und wird verwendet, wenn nur begrenzte Informationen über das Ziel verfügbar sind. Diese Ansätze basieren auf dem Konzept, dass ähnliche Verbindungen ähnliche Eigenschaften haben und mit ähnlichen Proteinen interagieren. Mit anderen Worten: Die vorhergesagten Ergebnisse dieser Ansätze hängen vollständig von der Anzahl bekannter Liganden pro Protein ab. Daher kann ihre Zuverlässigkeit durch ein unzureichendes Verhältnis von Liganden pro Protein beeinträchtigt werden5,6,7,8,9. Der zweite Ansatz ist der Docking-basierte Ansatz, der die 3D-Strukturen eines Liganden und eines Rezeptors nutzt, um die Bindungsaffinität zwischen ihnen zu bewerten10. Der molekulare Docking-Ansatz leidet unter dem Mangel an ausreichenden 3D-Strukturen von Liganden und Rezeptoren11. Der dritte vielversprechende Ansatz, der chemogenomische Ansatz, wurde als Identifizierung und Beschreibung aller möglichen Moleküle definiert, die mit beliebigen therapeutischen Zielen interagieren können, und ermöglicht es Forschern daher, sich mit der Frage der Vorhersage von Off-Target-Proteinen für therapeutische Kandidaten zu befassen12,13. Dieser Ansatz versucht, die Nachteile der oben genannten Methoden zu vermeiden, indem die Korrelationen zwischen dem chemischen Raum des Liganden und dem genomischen Raum des Proteins ermittelt werden14. Chemogenomische Ansätze können in fünf Typen eingeteilt werden: (1) Nachbarschaftsmodelle, (2) bipartite lokale Modelle, (3) Netzwerkdiffusionsmodelle, (4) Matrixfaktorisierungsmodelle und (5) merkmalsbasierte Klassifizierungsmodelle4. Die Matrixfaktorisierung ist eine der am häufigsten verwendeten Methoden zur DTI-Vorhersage15. Matrixfaktorisierungsmethoden16 manipulieren die DTIs und versuchen, eine latente Darstellung jedes Medikaments und jedes Ziels zu finden16,17,18. Trotz der vielen Vorteile dieser Methode weist die Matrixfaktorisierung mehrere Nachteile auf. Beispielsweise verwendet die Matrixfaktorisierung das lineare Innenprodukt zweier Vektoren. Folglich ist es nicht die beste Lösung, die Wechselwirkung oder Beziehung zwischen Medikament und Ziel vorherzusagen. Daher schlagen wir vor, die herkömmliche lineare Matrixfaktorisierung bei der Umwidmung von Arzneimitteln zu vermeiden. Die Autoren erwähnten die Probleme von Matrixfaktorisierungsmethoden in einer anderen Arbeit19.

In den letzten Jahren haben chemogenomische Methoden, die maschinelles Lernen nutzen, um DTIs vorherzusagen (z. B. Deep-, Transformer- und Graph-Neural-Network-Methoden), eine breite Anwendung gefunden. Diese Methoden kommen zum Einsatz, um die Nachteile anderer DTI-Vorhersageansätze zu umgehen. Wir stellen einige der modernsten chemogenomischen Methoden vor. NeoDTI20 ist eine auf einem graphischen neuronalen Netzwerk basierende Methode, die eine induktive Matrixvervollständigungsmethode verwendet, um die DTIs vorherzusagen. AutoDTI++21 verwendet eine Auto-Encoder-Lösung in Kombination mit Matrixfaktorisierung. Aufgrund der Verwendung der Matrixfaktorisierung weist diese Methode den Nachteil von Datenlecks auf. HIDTI22 generiert Einbettungen von Zielen und Medikamenten, indem es neuronale Netze auf ihre verschiedenen Eigenschaften anwendet und diese dann alle verkettet. Die Verkettung der verarbeiteten Informationen jedes Arzneimittel-Ziel-Paares wird einem verbleibenden neuronalen Netzwerk zugeführt, um deren Interaktion zu identifizieren. Diese Methode weist den Nachteil auf, dass sie spärlich ist und Einbettungen unvollständig erzeugt. MolTrans23 gehört zu transformatorbasierten Methoden, die Konzepte aus den tiefen Sprachmodellen übernehmen. TransDTI24 nutzt neben anderen vorab trainierten Einbettungen auch AlphaFold25 und leitet sie an ein Feed-Forward-Neuronales Netzwerk weiter, um DTIs zu identifizieren.

In diesem Artikel werden zwei Szenarien zur Vorhersage von DTIs mithilfe eines Deep Neural Network (DNN) vorgeschlagen. Sie unterscheiden sich hauptsächlich in der Art und Weise der Modellierung des Input-Drogen-Ziel-Paares. Wir nennen das erste Szenario „Indirect Embedding DTI“ oder einfach IEDTI und das zweite „Direct Embedding DTI“ oder DEDTI. Die Abbildungen 1 und 2 zeigen jeweils vorgeschlagene Frameworks. Wir verwenden heterogene Informationen, einschließlich Arzneimittel-Ziel-Wechselwirkungen, Arzneimittel-Arzneimittel-Wechselwirkungen, Arzneimittel-Nebenwirkungs-Assoziationen, Arzneimittel-Krankheits-Assoziationen, Ziel-Ziel-Wechselwirkungen, Ziel-Krankheits-Wechselwirkungen und Ähnlichkeiten von Zielen, um die DTIs vorherzusagen. Der Abschnitt „Methode“ bietet einen detaillierten Ausdruck davon.

IEDTIs Framework. Es besteht aus drei Schritten: Vorverarbeitung, Einbettungsgenerierung und DTI-Vorhersage. (I) Im ersten Schritt werden die Wirkstoff- und Zielmatrizen gelesen. Es wandelt die Arzneimittel-Nebenwirkungs-, Arzneimittel-Krankheits- und Ziel-Krankheits-Assoziationen in drei Ähnlichkeitsmatrizen um. Dieses Verfahren führt dazu, dass es vier gleich große Matrizen für Arzneimittel und drei gleich große Matrizen für Ziele gibt. Das Framework fasst die Arzneimittelmatrizen zusammen und fasst auch die drei Zielmatrizen zusammen. Es wendet k-Means an, um ähnliche Arzneimittel mit denselben Bezeichnungen zu versehen. Zur Visualisierung wird jedes Etikett in einer anderen Farbe dargestellt. Das Gleiche gilt für die Ziele. (II) Das Framework verwendet Triplet, um mithilfe von zwei DNN-Modulen Einbettungsvektoren für jedes Medikament und Ziel zu generieren. (III) Es verkettet die Einbettungen jedes Arzneimittel-Ziel-Paares und leitet sie an das dritte DNN-Modul weiter, um Wechselwirkungen vorherzusagen.

DEDTIs Framework. Dieses Framework besteht aus zwei Schritten, nämlich Vorverarbeitung und DTI-Vorhersage. (I) Im Vorverarbeitungsschritt liest das Framework die Arzneimittel- und Zielmatrizen. Es wandelt die Arzneimittel-Nebenwirkungs-Assoziationen, Arzneimittel-Krankheits-Assoziationen und Ziel-Krankheits-Assoziationen in drei Ähnlichkeitsmatrizen um. Dieses Verfahren führt dazu, dass es vier gleich große Matrizen für Arzneimittel und drei gleich große Matrizen für Ziele gibt. Das Framework fasst die Arzneimittelmatrizen zusammen und fasst auch die drei Zielmatrizen zusammen. (II) Das Framework verkettet jedes Medikament-Ziel-Paar. Anschließend werden die Verkettungen an ein Deep-Network-Modul weitergeleitet, um deren Interaktionen vorherzusagen.

IEDTI und DEDTI verwenden Arzneimittel-Ziel-Wechselwirkungen als Bezeichnungen und die übrigen Informationen als Eingabe für ihre Modelle. Wie in Abb. 1 dargestellt, besteht das IEDTI aus drei Schritten. Der erste Schritt, die Vorverarbeitung, umfasst das Lesen der Arzneimittel- und Zielmatrizen und die Erstellung der entsprechenden Merkmalsvektoren. Für Arzneimittel verfügen wir über zwei Matrizen für Arzneimittelinteraktionen und strukturelle Ähnlichkeiten zwischen Arzneimitteln. Darüber hinaus gibt es zwei weitere Matrizen für Arzneimittel-Krankheits- und Arzneimittel-Nebenwirkungs-Assoziationen. Der Vorverarbeitungsschritt nutzt die Kosinusähnlichkeit und wandelt die beiden letztgenannten Matrizen in Ähnlichkeitsmatrizen um. Infolgedessen haben Medikamente vier gleich große Matrizen. Wir fassen sie im Vorverarbeitungsschritt zusammen und generieren einen Merkmalsraum für Arzneimittel. Anschließend wollen wir den ursprünglichen Merkmalsraum in einen niedrigerdimensionalen Raum umwandeln. Der neue Raum muss jedoch die Ähnlichkeiten zwischen den Merkmalsvektoren des ursprünglichen Raums bewahren. Zu diesem Zweck wird der Triplettverlust implementiert, um eine sinnvolle Dimensionsreduzierung zu erreichen. Der Triplettverlust erfordert Beschriftungen der korrelierten Merkmalsvektoren. Der ursprüngliche Datenraum hat keine Beschriftungen. Daher wendet das Framework k-Mittelwerte auf die Arzneimittelvektoren an und ähnliche Arzneimittel erhalten die gleichen Bezeichnungen. Mit anderen Worten: Wir verwenden k-Mittel zur Probenkennzeichnung. Diese Kennzeichnung ist entscheidend für die Vorbereitung der Einbettungsvektoren. Das gleiche Verfahren wird für die Ziele im Vorverarbeitungsschritt durchgeführt.

Im nächsten Schritt – der Einbettungsgenerierung – verwendet IEDTI zwei Deep-Network-Module (\(DNN_1\) und \(DNN_2\)) für Medikamente und entsprechende Ziele. Mithilfe von \(DNN_1\) wird jeder Medikamentenmerkmalsvektor einem Einbettungsraum zugeordnet. Diese neuen Darstellungen müssen eine sinnvolle Interpretation ähnlicher Arzneimittel mit ähnlichen Einbettungen enthalten. Das Gleiche gilt für Ziele mit \(DNN_2\).

Der letzte Schritt von IEDTI – die DTI-Vorhersage – sagt die Wechselwirkung zwischen jedem Medikament-Ziel-Paar voraus. Andererseits konzentriert sich DEDTI ausschließlich auf die DTI-Vorhersage. DEDTI besteht aus zwei Schritten: „Vorverarbeitung“ und „DTI-Vorhersage“. Der Unterschied zu IEDTI besteht darin, dass der Einbettungsgenerierungsschritt ausgeschlossen ist. Wir besprechen sie im Folgenden ausführlicher.

Die Datensätze stammen aus einer früheren Studie zur Vorhersage inhomogener DTIs11 (wir nennen sie DTINet-Datensatz). Dieser Datensatz enthält Daten von 708 Arzneimitteln aus DrugBank (Version 3.0)26, 1512 Zielproteinen aus der HPRD-Datenbank (Version 9)27, 5603 Krankheiten aus der Comparative Toxicogenomics-Datenbank28 und 4192 Arzneimittelnebenwirkungen aus der SIDER-Datenbank (Version 2)29 . Darüber hinaus gibt es 1923 bekannte Wechselwirkungen zwischen Arzneimitteln und Zielmolekülen30.

Darüber hinaus haben wir eine externe Validierung der Goldstandard-Datensätze von Enzymen, GPCR, Ionenkanälen und Kernrezeptoren31 durchgeführt. Tabelle 1 zeigt alle Statistiken der Datensätze.

Wie bereits erwähnt, bewertet diese Studie zwei Szenarien zur Vorhersage von Arzneimittel-Ziel-Wechselwirkungen – der Unterschied zwischen diesen beiden Szenarien beruht auf unterschiedlichen Phasen der Datenvorverarbeitung und -manipulation. Bevor wir uns mit den Szenarien befassen, erläutern wir zunächst die Datenverarbeitung in den Datensätzen. Aufgrund des Ziels der DTI-Vorhersage befasst sich dieser Artikel mit den Wechselwirkungen zwischen Arzneimitteln und Zielmolekülen. Acht Matrizen enthalten alle Informationen und Interaktionen, die für unsere DTI-Vorhersage erforderlich sind.

X oder Arzneimittel-Ziel-Wechselwirkungen mit der Dimension \(708\times 1512\) [einige Studien berücksichtigen eine andere Matrix namens Target-Arzneimittel-Matrix. Letzteres ist nichts anderes als die Umsetzung des ersteren. In diesem Artikel wird die Wechselwirkung zwischen Medikament und Ziel als Vorhersageetikett verwendet, weshalb wir nur eines davon benötigen.].

\(D^{(1)}\) oder strukturelle Ähnlichkeiten zwischen Medikamenten und Medikamenten mit der Dimension \(708\times 708\).

\(D^{(2)}\) oder Arzneimittel-Wechselwirkungen mit der Dimension \(708\times 708\).

\(D_{raw}^{(3)}\) oder Arzneimittel-Krankheits-Assoziationen mit der Dimension \(708\times 5603\).

\(D_{raw}^{(4)}\) oder Arzneimittel-Nebenwirkungs-Assoziationen mit der Dimension \(708\times 4192\).

\(T^{(1)}\) oder Ziel-Ziel-Interaktionen mit der Dimension \(1512\times 1512\).

\(T^{(2)}\) oder Ziel-Ziel-Sequenzähnlichkeiten mit der Dimension \(1512\times 1512\).

\(T_{raw}^{(3)}\) oder Ziel-Krankheits-Assoziationen mit der Dimension \(1512\times 5603\) [Es wird bald klar sein, warum wir für einige der Matrizen den Index „raw“ verwendet haben \ (D_{raw}^{(3)}\), \(D_{raw}^{(4)}\) und \(T_{raw}^{(3)}\). Im Moment handelt es sich bei diesen Matrizen nicht um Ähnlichkeitsmatrizen.].

Es ist erwähnenswert, dass wir die erste Matrix X von allen anderen Matrizen unterscheiden. Während wir die anderen Matrizen als Eingabemerkmale betrachten, wird X als Vorhersagebezeichnungen der DTIs bezeichnet. Das erste Szenario, Szenario 1, befasst sich zusätzlich zur DTI-Vorhersage mit der Einbettungsgenerierung. Das zweite Szenario, Szenario 2, befasst sich ausschließlich mit der Interaktionsvorhersage. Mit anderen Worten: Während sich Ersteres mit Einbettungen zur weiteren Analyse befasst, befasst sich Letzteres mit der Vorhersagequalität. Erwähnenswert ist, dass beide Methoden den gleichen Vorverarbeitungsschritt aufweisen.

Diese beiden Szenarien haben einen einzigen gemeinsamen Schritt der Datenvorverarbeitung. Beide zielen darauf ab, Informationen aus Arzneimittel- (und Protein-)Matrizen in einer einzigen Matrix zu kombinieren. Der erste Schritt transformiert die Matrizen für Medikamente – \(D^{(i)},~1\le i\le 4\) – in eine einzelne Merkmalsmatrix, D, und für Ziele – \(T^{(j) },~1\le j\le 3\) – in eine einzelne Merkmalsmatrix T. \(D^{(1)}\) und \(D^{(2)}\) haben beide das Gleiche Größe von \(708\times 708\). Um den Merkmalsraum der Medikamente zu generieren, konvertieren wir die beiden anderen \(D^{(3)}\) und \(D^{(4)}\) in einen Raum mit einer Größe gleich \(D^{( 1)}\) und \(D^{(2)}\). Mit anderen Worten: Wir verzichten auf die explizite Darstellung von Krankheiten und Nebenwirkungen aus \(D^{(3)}\) bzw. \(D^{(4)}\). Wir haben die Ähnlichkeitsmatrizen der Arzneimittelkrankheits-, Arzneimittelnebenwirkungs- und Zielkrankheitsmatrizen anhand der Metrik „Cosinus-Ähnlichkeit32“ erstellt. Diese Art von Ähnlichkeit wurde verwendet, da sie Skaleninvarianz, Richtungsbewusstsein, Verwendung in Empfehlungssystemen und Recheneffizienz aufweist33,34.

Angenommen, O ist eine Matrix mit der Größe \(o_1\times o_2\). Das Ziel besteht darin, die Ähnlichkeit zwischen den Zeilen zu berechnen. Zu diesem Zweck wenden wir die Kosinusähnlichkeit an. Seine Ausgabe ist eine quadratische Matrix R mit der Größe \(o_1\times o_2\). Somit ist die Ähnlichkeit der Zeilen k und \(\ell ,~1\le k,\ell \le o_1\), \(R_{k\ell }\) und gleich

Dabei stellt „\(\cdot \)“ das innere Produkt zweier Vektoren dar und \(||\cdot ||\) zeigt die \(\ell ^2\)-Norm des Vektors. Gleichung 1 wird auf alle Paare \((k,\ell ), 1\le k,\ell \le o_1\) angewendet. Die resultierende Matrix R hat die Größe \(o_1\times o_1\). \(D^{(1)}\), \(D^{(2)}\), \(T^{(1)}\) und \(T^{(2)}\) sind bereits Ähnlichkeitsmatrizen. Daher wenden wir Gleichung 1 auf die verbleibenden Matrizen an – \(D_{raw}^{(3)},\) \(D_{raw}^{(4)},\) und \(T_{raw}^{( 3)},\) und die Ergebnisse sind \(D^{(3)},\) \(D^{(4)},\) und \(T^{(3)}.\)

Letztendlich gibt es vier Ähnlichkeitsmatrizen der Arzneimittel \(D^{(1)}\), \(D^{(2)}\), \(D^{(3)}\) und \(D^ {(4)}\) mit der gleichen Größe von \(708\times 708\), und es gibt drei Ähnlichkeitsmatrizen \(T^{(1)}\), \(T^{(2)}\) und \(T^{(3)}\) für Zieldaten, deren Größe \(1512\times 1512\) beträgt. Diese Konvertierungen zielen darauf ab, Merkmalsvektoren sowohl für Medikamente als auch für Ziele zu generieren. Dazu summieren wir die Arzneimittelähnlichkeitsmatrizen für Arzneimittel und die Zielähnlichkeitsmatrizen für Ziele. Somit werden die endgültigen Arzneimittel- und Ziel-Ähnlichkeitsmatrizen (D und T) durch Summierung der Ähnlichkeitsmatrizen wie folgt erhalten.

Wir betrachten D und T als Merkmalsvektoren für Arzneimittel bzw. Ziele. Mit anderen Worten: Jede Reihe von D entspricht einer informativen Darstellung eines bestimmten Medikaments. Das Gleiche gilt für den Zielmerkmalsvektor T. Indem wir D und T haben, können wir die Szenarien beschreiben.

Dieser Unterabschnitt enthält die mathematische Formulierung von IEDTI und DEDTI.

Dieses Szenario zielt darauf ab, Einbettungen und DTI-Vorhersagen unter Verwendung der Eingabemerkmalsvektoren D und T zu erstellen. Es generiert eine Einbettung für jedes Medikament \({{\textbf {d}}}_i=D(i,:);~1\le i \le m\) und jedes Ziel \({{\textbf {t}}}_j=T(j,:);~1\le j\le n\). Die Einbettungen von \({{\textbf {d}}}_i\) und \({{\textbf {t}}}_j\) sind \(\bar{{{\textbf {d}}}}_i\ ) bzw. \(\bar{{{\textbf {t}}}}_j\). Diese neuen Darstellungen nehmen weniger Platz ein, was zu schnelleren und effizienteren Berechnungen führt. Darüber hinaus haben sie eine Bedeutung, dh ähnliche Vektoren haben ähnliche Einbettungsdarstellungen und unterschiedliche Vektoren haben unterschiedliche Darstellungen. Anschließend werden die DTIs vorhergesagt. Wir erklären zunächst die Art der Einbettung der Generierung. Wir beginnen mit der Beschreibung der Herstellung von Arzneimitteleinbettungen. Jedes Medikament \({{\textbf {d}}}_i\) der D-Matrix wird in einen neuen Darstellungsraum abgebildet und durch \(\bar{{{\textbf {d}}}}_i\) dargestellt. Mit anderen Worten: Diese Arzneimittel werden in eine neue Domäne umgewandelt, indem sie die „signifikante Eigenschaft“ eines ähnlichen Vektorpaars mit einem ähnlichen Einbettungsvektorpaar erfüllen und umgekehrt. Daher suchen wir nach einer Funktion, also \(g_1\), wo sie jedes \({{\textbf {d}}}_i\) von D in einen Einbettungsvektor mit der Eigenschaft umwandelt, dass ähnliche Einbettungen eine ähnliche Einbettung haben müssen Vektoren und unähnliche müssen eine unterschiedliche Einbettung haben, oder formal:

wobei \(\tau _D\in {\mathbb {R}}^+\) und \(\tau _{\bar{D}}\in {\mathbb {R}}^+\) Vergleichsschwellenwerte für Arzneimittel sind ' Originaldarstellungen bzw. eingebettete Darstellungen. Es ist erwähnenswert, dass \({{\textbf {d}}}_i\in {\mathbb {R}}^m\) und \(\bar{{{\textbf {d}}}}_i\in { \mathbb{R}}^{f_1}\), wobei \(f_1\ll m\). Zwei Funktionen \(dist_D\) und \(dist_{\bar{D}}\) sind jeweils \({\mathbb {R}}^m\times {\mathbb {R}}^m\rightarrow {\mathbb {R}}^+\) und \({\mathbb {R}}^{f_1}\times {\mathbb {R}}^{f_1}\rightarrow {\mathbb {R}}^+\) Funktionen, Wird verwendet, um die Ähnlichkeit zwischen Vektoren in D und ihren Einbettungsvektoren zu messen. Die Distanzfunktion kann jede legitime Funktion sein, die unterschiedliche Vektoren unterscheidet und ähnliche Vektoren in der Koordinate der Einbettungsdarstellung zusammenfasst. Die gleiche Bedingung gilt für die Mitglieder der Zielähnlichkeitsmatrix (T). Wir suchen also nach einer Funktion \(g_2\) mit ähnlichen Bedingungen auf \({{\textbf {t}}}_j\), oder formal:

wobei \(\tau _T\in {\mathbb {R}}^+\) und \(\tau _{\bar{T}}\in {\mathbb {R}}^+\) Vergleichsschwellenwerte für Ziele sind ' Originaldarstellungen \({{\textbf {t}}}_i\in {\mathbb {R}}^n\) und eingebettete Darstellungen \(\bar{{{\textbf {t}}}}_i\in { \mathbb{R}}^{f_2}\), wobei \(f_2\ll n\), bzw. Jede Zeile, \(\bar{{{\textbf {d}}}}_i\) und \(\bar{{{\textbf {t}}}}_j\) bettet Vektoren in eine neue Domäne ihrer entsprechenden ein Zeilen, \({{\textbf {d}}}_i\) und \({{\textbf {t}}}_j\), in Ziel- bzw. Arzneimittelähnlichkeitsmatrizen. Ähnlich wie \(dist_D\) und \(dist_{\bar{D}}\) sind zwei weitere Funktionen \(dist_T\) und \(dist_{\bar{T}}\) jeweils \({\mathbb { R}}^n\times {\mathbb {R}}^n\rightarrow {\mathbb {R}}^+\) und \({\mathbb {R}}^{f_2}\times {\mathbb {R }}^{f_2}\rightarrow {\mathbb {R}}^+\) Funktionen, die verwendet werden, um die Ähnlichkeit zwischen Vektoren in T und ihren Einbettungsvektoren zu messen. Die \(\bar{{{\textbf {d}}}}_i,~1\le i \le m\) und \(\bar{{{\textbf {t}}}}_j,~1\le j \le n\) sind der erste Typ der Ausgabe von Szenario 1. Der nächste Typ ist die Vorhersage der Wechselwirkung zwischen Arzneimittel-Ziel-Paaren. Dazu verwendet es jedes Paar von \(\bar{{{\textbf {d}}}}_i\) und \(\bar{{{\textbf {t}}}}_j\) und ruft a auf Funktion \(g_3:{\mathbb {R}}^{f_1}\times {\mathbb {R}}^{f_2}\rightarrow {\mathbb {R}}\) wobei \(g_3(\bar{{{ \textbf {d}}}}_i,\bar{{{\textbf {t}}}}_j)\ approx x_{ij}\). Wir definieren es formal wie folgt:

Insbesondere sind die obigen Erläuterungen die konzeptionelle Formalisierung unseres Vorschlags. Die Parameter \(\tau _D\) und \(\tau _T\) werden mithilfe von Clustering- und DNN-Modulen behandelt. Mit anderen Worten: Wir werden diese drei Ziele mit einer DNN-Lösung angehen. Unser vorgeschlagenes DNN besteht aus drei Modulen (\(DNN_1,~DNN_2,~DNN_3\)), und jedes von ihnen modelliert eine der Funktionen \(\{g_1,g_2,g_3\}\). Das erste Modul (\(DNN_1\)) dient der Berechnung der Einbettung der Arzneimittelähnlichkeitsvektoren (D). Seine Eingabevektoren sind die Zeilen (\({{\textbf {d}}}_i\)) von D, und seine Ausgabe ist die neue Darstellung jeder Zeile, \(\bar{{{\textbf {d}}} }_ich\). Das zweite Modul (\(DNN_2\)) dient der Erfassung der Zieleinbettungsvektoren (\(\bar{{{\textbf {t}}}}_j\)). Seine Eingabevektoren stammen aus den Zeilen (\({{\textbf {t}}}_j\)) der Zielähnlichkeitsmatrix. Diese beiden DNN-Module fungieren als Triplett-Methoden. Schließlich das dritte Modul (\(DNN_3\)), indem die Eingaben in Form verketteter Vektoren \((\bar{{{\textbf {d}}}}_i,\bar{{{\textbf {t }}}}_j)\), sagt die Wechselwirkungen zwischen Entitäten von D- und T-Matrizen voraus. Im nächsten Abschnitt wird die Struktur des entworfenen DNN detaillierter beschrieben.

Dieses Szenario konzentriert sich direkt auf die DTI-Vorhersage. Szenario 2 besteht dazu aus zwei Schritten. Der erste Schritt besteht darin, den für die DTI-Vorhersage erforderlichen Merkmalsvektor zu definieren. Es nutzt die Vektoren von D und T, um den für die Vorhersage erforderlichen Merkmalsvektor zu generieren. Mit anderen Worten: Jeder Merkmalsvektor ist ein verfügbares Arzneimittel-Ziel-Paar. Jeder Merkmalsvektor \({{\textbf {z}}}\) wird aus \({{\textbf {d}}}_i=D(i,:);~1\le i\le m\) abgeleitet. mit Ziel \({{\textbf {t}}}_j=T(j,:);~1\le j\le n\), oder \({{\textbf {z}}}=({{\ textbf {d}}}, {{\textbf {t}}})\) und \({{\textbf {z}}}\in {\mathbb {R}}^{m+n}\). Der nächste Schritt besteht darin, die Wechselwirkung zwischen jedem gegebenen Medikament-Ziel-Paar vorherzusagen. Wir zeigen beide Schritte wie folgt.

Dieser Unterabschnitt bietet die umfassende Architektur von IEDTI und DEDTI. Wir beschreiben sie einzeln wie folgt.

Dieser Unterabschnitt stellt die umfassende Architektur von IEDTI vor. Wir beschreiben es wie folgt in drei verschiedenen Modulen.

Erstes Modul des Deep Neural Network Das erste Modul (\(DNN_1\)) erhält die \({{\textbf {d}}}_i=D(i,:),\forall i \in \{1,~\cdots ,m\}\) als Eingabe und gibt für jeden von ihnen den entsprechenden Einbettungsvektor zurück. Wie bereits erwähnt, sollten die Ähnlichkeiten und Unähnlichkeiten zwischen Zielen auch in ihren entsprechenden Einbettungsvektoren beibehalten werden. Mit anderen Worten: Wenn zwei Vektoren im Hauptraum ähnlich sind, sollte ihre Transformation im Einbettungsraum ähnlich sein. Um Ähnlichkeiten im Einbettungsraum beizubehalten, machen wir uns die Idee zunutze, dass Bordes et al. eingeführt haben35. Allerdings haben wir die Zielfunktion geändert. Nehmen wir an, dass wir für jedes \({{\textbf {d}}}_i\ die „Menge“ seiner ähnlichen Vektoren in D finden können. Wir nennen es \(Smlr_{{{\textbf {d}}} _ich}\) . Andererseits weist jedes \({{\textbf {d}}}_i\) Unähnlichkeiten oder weniger Ähnlichkeiten mit den übrigen Vektoren von D auf. Unter Verwendung dieser beiden Mengen ähnlicher und unähnlicher Vektoren für jedes \({{ \textbf {d}}}_i\); Wir berechnen seine Darstellung \(\bar{{{\textbf {d}}}}_i\). Ihre Formulierung kann sein:

Nachdem wir diese Menge und ihre Komplementmenge für jedes \({{\textbf {d}}}_i\in D\ haben, definieren wir die folgende Zielfunktion:

Es ist bemerkenswert, dass die Menge \(Smlr_{{{\textbf {d}}}_i}\) basierend auf \(dist_D\) und \({{\textbf {d}}}\ definiert ist, aber \( {\mathscr {L}}_d\) basiert auf \(dist_{\bar{D}}\) und \(\bar{{{\textbf {d}}}}\). Die ähnlichen Vektoren sollten einen kleineren Abstand haben und die unähnlichen Vektoren müssen einen größeren Abstand haben. Wenn das Modell ordnungsgemäß funktioniert, muss \({\mathscr {L}}_d\) nahe Null sein. Das Ziel von \(DNN_1\) besteht also darin, die Kostenfunktion \({\mathscr {L}}_d\) zu minimieren. Der Parameter \(\gamma \) ist ein Randhyperparameter zur Abstimmung der Zielfunktion. Diese Funktion wird als Triplett bezeichnet. Zu diesem Zweck können wir über mehrere Schichten neuronaler Netze verfügen. Die Anzahl der Neuronen der Eingabeschicht muss gleich m sein (die Länge von \({{\textbf {d}}}_i\)). Es ist auch notwendig, dass die Anzahl der Neuronen der Ausgabeschicht gleich \(f_1\) ist (die Länge von \(\bar{{{\textbf {d}}}}_i\)). Es ist notwendig, sinnvolle Einbettungen zu haben. Mit anderen Worten: Ähnliche Medikamente müssen im Einbettungsraum ähnliche Darstellungen haben. Dieses Ziel erfordert die Definition einer Ähnlichkeit zwischen der ursprünglichen Darstellung von Arzneimitteln. Zu diesem Zweck verwenden wir den k-means-Algorithmus, wenden ihn auf die Arzneimittelvektoren an und definieren Sätze ähnlicher Arzneimittel. Mithilfe dieser Clusterbildung berechnet \(DNN_1\) ähnliche Einbettungen für die Arzneimittel jedes Satzes. Wie oben erwähnt, haben wir die k-means-Methode angewendet, um ähnliche Medikamente (und ähnliche Proteine) in dieselben Cluster einzuordnen. Dann erhalten wir eine neue Darstellung unter Verwendung einer halbharten Triplett-Verlustfunktion. Dieser Ansatz führt zu einem kürzeren Abstand zwischen jeweils zwei Mitgliedern in einem Cluster und zu einer größeren Lücke zwischen jedem Clusterpaar. Diese Cluster fungieren als Beschriftungen und die Verlustfunktion verwendet sie, um sinnvolle Einbettungen zu erzeugen. Abbildung 4 zeigt t-SNE-Darstellungen von Medikamenten und Zielen vor und nach der Anwendung des Tripletts. Sie zeigen die Leistungsfähigkeit der k-means-Darstellung sowie die Anwendung von Triplett-Einbettungsvektoren. Wir haben die Anzahl der Cluster so gewählt, dass die Cluster ungefähr gleich sein müssen. Daher haben wir 2 bis 64 als Anzahl der Cluster für Arzneimittel untersucht, und 4 ist die bestmögliche Anzahl von Arzneimittelclustern. Abbildung 4a veranschaulicht die k-Mittelwert-Darstellungen von Arzneimitteln. Abbildung 4b zeigt die Trennung dieser Arzneimittel in der Einbettungskoordinate. Der Vergleich zweier Figuren zeigt die Unterscheidungskraft des Tripletts. Das Gleiche galt für die Ziele; Die beste Anzahl an Clustern war 5. Abbildung 4c zeigt das Ergebnis der Anwendung von k-means auf Ziele. Schließlich visualisiert Abb. 4d die Einbettungen der endgültigen Ziele.

Zweites Modul des Deep Neural Network Das zweite Modul (\(DNN_2\)) funktioniert wie sein Geschwister \(DNN_1\). Der Unterschied besteht darin, dass \(DNN_1\) Einbettungen von \({{\textbf {d}}}_i\in D,~i \in \{1,\cdots ,m\}\ berechnet, \(DNN_2\ ) berechnet \({{\textbf {t}}}_j\in T,~j \in \{1,\cdots ,n\}\). Für jedes \({{\textbf {t}}}_j\) definieren wir auch Mengen ähnlicher Vektoren:

Mit der Ähnlichkeitsmenge jedes \({{\textbf {t}}}_i\in T\) und seines entsprechenden Komplements definieren wir die folgende Zielfunktion:

Wie wir für \({{\textbf {d}}}\ erwähnt haben, muss der Abstand zwischen ähnlichen und unähnlichen Vektoren auch für \({{\textbf {t}}}\ gleich funktionieren. Wenn das Modell ordnungsgemäß funktioniert, muss \({\mathscr {L}}_t\) nahe Null sein, und das Ziel von \(DNN_2\) besteht darin, die Kostenfunktion \({\mathscr {L}}_t\ zu minimieren ). Zu diesem Zweck sollte die erste Schicht von \(DNN_2\) n Neuronen haben und die Ausgabeschicht von \(DNN_2\) muss \(f_2\) Neuronen haben. Im Einklang mit dem vorherigen Unterabschnitt wenden wir den k-means-Algorithmus an, um die Menge ähnlicher Ziele zu lokalisieren.

Drittes Modul des Deep Neural Network Das dritte Modul des neuronalen Netzwerks (DNN_3) ist für die DTI-Vorhersage zuständig. Die Eingabe von \(DNN_3\) sind die eingebetteten Darstellungen des Arzneimittels und des Ziels aus \(DNN_1\) und \(DNN_2\) – die Ausgabe von \(DNN_1\) ist der Vektor \(\bar{{{\ textbf {d}}}}_{f_1\times 1}\), und die Ausgabe von \(DNN_2\) ist der Vektor \(\bar{{{\textbf {t}}}}_{f_2\times 1 }\). Das Eingabeformat von \(DNN_3\) ist die Verkettung von \(\bar{{{\textbf {d}}}}\) und \(\bar{{{\textbf {t}}}}\), oder \([\bar{{{\textbf {d}}}}^T \bar{{{\textbf {t}}}}^T]^T\). Die Anzahl der Neuronen der Eingabeschicht von \(DNN_3\) ist also gleich \(f_1+f_2\). Wie oben erwähnt, besteht die Rolle des dritten Abschnitts in der Berechnung des Ausmaßes der Wechselwirkung zwischen \(\forall i \in \{1,\cdots ,m\}: {{\textbf {d}}}_i\in D \) und \(\forall j \in \{1,\cdots ,n\}: {{\textbf {t}}}_j\in T\), oder \(x_{ij}\). Die Ausgabeschicht hat ein Neuron, eine Näherung \(x_{ij}\). Formal ist das Ziel von \(DNN_3\).

Denn \(\bar{{{\textbf {d}}}}_i\) und \(\bar{{{\textbf {t}}}}_j\) werden aus \(DNN_1\) und \(DNN_2) ermittelt \), können wir die Zielfunktion umschreiben als

wobei \(\mathbin \Vert \) die Verkettungen zweier Vektoren zeigt. Es muss erwähnt werden, dass alle \(DNN_1\), \(DNN_2\) und \(DNN_3\) mehrere verborgene Schichten haben können. Wir besprechen dies ausführlicher in den Abschnitten „Umsetzung“ und „Diskussion“. Abbildung 1 zeigt die allgemeine Struktur des ersten vorgeschlagenen Szenarios.

Es ist bemerkenswert, dass das IEDTI-Modell kein End-to-End-Modell ist. Daher ist die Fehlerausbreitung kein End-to-End-Prozess. und jedes Modul hat seine eigene Fehlerausbreitung.

Das tiefe Netzwerk des zweiten Szenarios ähnelt dem ersten. Der einzige Unterschied besteht im Eingabevektor des Netzwerks. Sein Eingabevektor ist die Verkettung von jeweils \({{\textbf {d}}}_i\) und \({{\textbf {t}}}_j\). Formal,

oder genauer gesagt, es ist so

Die erforderlichen Neuronen der Eingabeschicht sind gleich \(m+n\), und die letzte Schicht enthält ein einzelnes Neuron, um jeden DTI vorherzusagen.

In beiden beschriebenen Szenarien haben wir eine zehnfache Kreuzvalidierung implementiert, um genaue Informationen über die Leistung unseres Algorithmus bereitzustellen. Um die Parameter abzustimmen, haben wir die Ergebnisse mit den Vorschlägen aus früheren Studien zum Thema Deep Learning und DTI-Vorhersage getestet. Die Ergebnisse zeigen, dass die Parameter in dieser Arbeit gut funktionieren.

DEDTI-Modell Unser erstes Modell verwendet die Verkettung der i-ten Protein- und j-ten Arzneimittelvektordarstellungen, \(c_{ij}\), als Eingabe. Daher ist die Eingabeform (2220, 1), da wir 708 Medikamente und 1512 Ziele haben. Anschließend wird die Eingabe \(c_{ij}\) an vier aufeinanderfolgende Conv1D-Ebenen mit der Relu-Aktivierungsfunktion weitergeleitet, wobei auf jede eine Batch-Normalisierung und ein Dropout von 0,5 folgen. Als nächstes verwenden wir eine dichte Schicht nach einer abgeflachten Schicht, gefolgt von einem Dropout von 0,5. Schließlich sagt eine dichte Schicht mit einer Sigmoid-Aktivierungsfunktion die Wechselwirkung zwischen Medikament und Protein voraus. Wir haben unser Modell mit dem Adam-Optimierer und der binären Kreuzentropieverlustfunktion zusammengestellt. Die Interaktion ist binärwertig. Null zeigt keine Interaktion und eins steht für eine gültige Interaktion. Wir haben auch die anfängliche Bias-Technik in unserer letzten dichten Schicht verwendet, um die Eigenschaft des Ungleichgewichtsdatensatzes zu berücksichtigen. Unsere anfängliche Tendenz ist wie folgt:

In diesem Modell haben wir in der Trainingsphase die Batchgröße auf 1024 festgelegt.

IEDTI-Modell Unsere Vorhersagephase im Triplett-Modell ist die gleiche wie in unserem ersten Modell. Hier haben wir jedoch zwei zusätzliche Schritte. Zunächst verwenden wir k-Mittelwerte für Arzneimittel und Proteine ​​getrennt, um darin verschiedene Cluster zu finden. Dann erhalten wir neue Darstellungen für sie, indem wir den halbharten Triplettverlust verwenden. Unsere neue Vektordarstellung für Medikamente und Proteine ​​hat eine Größe von 256. Danach füttern wir ihre Verkettungen in unsere Vorhersagephase, ähnlich wie in unserem vorherigen Modell. Die Eingabeform in diesem Szenario ist jedoch (512). Da die Eingabeform hier kleiner ist als beim Vorgängermodell, haben wir unsere Chargengröße für dieses Modell auf 64 festgelegt.

Wir verwenden eine zehnfache Kreuzvalidierung, um die Leistung der Modelle zu bewerten. Zur Bewertung der Methoden verwendeten wir verschiedene Metriken wie AUC-ROC, AUPR, F1-Score und MCC. AUC-ROC ist für Ungleichgewichte nicht geeignet. Daher haben wir die anderen Bewertungsmetriken verwendet, um den Fall unausgeglichener Daten abzudecken. Wir berechnen die Sensitivitäts- (Erinnerungs-), Spezifitäts-, Präzisions- und F1-Score-Metriken basierend auf den folgenden Gleichungen.

Während der F1-Score zur unausgeglichenen Datenauswertung verwendet wird, haben wir MCC aufgrund seiner Vorteile bei der binären Klassifizierung in Betracht gezogen36. Seine Gleichung lautet wie folgt.

Der Parameter m zeigt die Anzahl der Medikamente und die Anzahl der Ziele n stellt die Anzahl der Ziele dar, die Anzahl der Krankheiten ist \(n_{di}\) und die Anzahl der Nebenwirkungen ist \(n_{se}\) . Wir gehen davon aus, dass es \(e_{emb}\) Epochen gibt, die für die Erzeugung sekundärer Darstellungen von Arzneimitteln und Zielen erforderlich sind, und dass jede Epochenzeit gleich \(T_{e}\) für Arzneimittel und Ziel ist. Der Einfachheit halber haben wir keinen Unterschied in der Umwandlungszeit zwischen dem Medikament und dem Ziel angenommen. Schließlich gehen wir davon aus, dass die Anzahl der Epochen im Vorhersagemodell gleich \(e_{p}\) ist und dass das Zeitintervall jeder Epoche gleich \(T_{p}\) ist.

DEDTI und IEDTI müssen die primäre Darstellung jedes Medikaments und jedes Proteins berechnen. Zwei Ähnlichkeitsmatrizen für Arzneimittel liegen bereits vor. Wir müssen zwei weitere Ähnlichkeitsmatrizen für Arzneimittel mit Krankheiten und Nebenwirkungen berechnen, die für die nächsten beiden Arzneimittelähnlichkeiten erforderlich sind. In der Arzneimittel-Krankheits-Matrix wenden die Methoden die Kosinusähnlichkeit für jedes Arzneimittelpaar an. Daher beträgt seine zeitliche Komplexität \(O(m^2n_{di})\). Das Gleiche gilt für die Arzneimittelnebenwirkungsmatrix; somit beträgt die Komplexität seiner Konvertierung \(O(m^2n_{se})\). Insgesamt beträgt die Umrechnung für Medikamente \(O(m^2(n_{di}+n_{se})\). Ziele erfordern eine zusätzliche Berechnung der Ähnlichkeit von Krankheiten. Ähnlich wie bei der Medikamenten-Krankheits-Matrix ist die Komplexität der Berechnung Die Ähnlichkeit zwischen den Zielen basierend auf ihren häufigen Krankheiten beträgt \(O(n^2n_{di})\). In diesem Artikel ist n größer als m und die Komplexität der Ähnlichkeitsberechnung beträgt \(O\left( e_{ emb}\left( (m+n)T_{e}\right) \right) \), und \(m

Beide Modelle verfügen über ein ähnliches Vorhersagemodul und ihre Komplexität zur Bewertung aller Ziele und Medikamente beträgt \(O\left( e_{p}mnT_{p}\right) \). Ihr Unterschied liegt in \(T_{p}\), wobei IDETI eine geringere zeitliche und räumliche Komplexität benötigt als DEDTI.

Es ist bemerkenswert, dass IEDTI mit drei DNN-Modulen (zwei für die Produktion von Einbettungsvektoren und ein Modul für die Vorhersage) alle Schritte der Einbettungsvorbereitung und -vorhersage enthält, während die modernsten Methoden die verfügbaren Einbettungen verwenden (z. B. TransDTI). ) oder eine höhere Komplexität aufweisen (IMCHGAN).

Strukturbasiertes molekulares Docking ist eine virtuelle Alternative zu kostspieligen und zeitaufwändigen Laborexperimenten, um die „beste“ Ausrichtung eines Arzneimittels für ein bestimmtes Ziel zu finden. Daher haben wir diese Technik verwendet, um das Interaktionspotenzial zwischen Chlorzoxazon-PTGS2 und Tetrabenazin-ADORA1 als zwei neuartigen vorhergesagten Arzneimittel-Ziel-Paaren zu rationalisieren. Zu diesem Zweck wurden Kristallstrukturen von ADORA1 (PDB 5n2s) und PTGS2 (PDB 3QMO) aus der RCSB PDB-Proteindatenbank erhalten37. Außerdem wurden die 3D-SDF-Strukturen von Tetrabenazin und Chlorzoxazon vom NCBI PubChem38 heruntergeladen. Der native Ligand HEATM und andere Lösungsmittelmoleküle in beiden Proteinstrukturen wurden mithilfe von Discovery Studio entfernt und die Methode des steilsten Abstiegs wurde zur Energieminimierung verwendet. Anschließend wurde das Tool Swiss PDB Viewer (SPDBV)39 verwendet, um die stabilste Konformation von Proteinen zu erhalten. Schließlich wurden die letzten Schritte der Proteinvorbereitung, einschließlich der Zugabe polarer Wasserstoffe und Kollman-Ladungen, mit den Autodock-Tools (ADT) durchgeführt. Die Herstellung der Liganden erfolgte durch Zugabe polarer Wasserstoffe und Gasteiger-Ladungen. Außerdem wurden Wurzelerkennung und Torsionsauswahl aus dem Torsionsbaum durchgeführt, um alle drehbaren Bindungen zu drehen. Um das „aktive Zentrum“ in der Bindungsposition von ADORA1 zu bestimmen, wurde die Kristallstruktur des stabilisierten ADORA1in-Komplexes mit PSB36 bei 3,3 A mit dem LIGPLOT+-Tool40 visualisiert. Das erhaltene Muster zeigt, dass His 1356, Trp 1352, Leu 1355, Met 1285, Asn 1359, Thr 1375, Glu 1277, Thr 1362, Phe 1276, Val 1192, Ile 1174, Ile 1379 und Ala 1196 die wichtigsten beteiligten Aminosäuren sind bei der Bildung dieses Komplexes. Darüber hinaus wurde die Röntgenkristallstruktur von NS-398, gebunden an Cyclooxygenase-2, analysiert. Arg 120, Val 523, Ala 527, Val 349, Ser 530, Tyr 385, Trp 387, Gly 526, Leu 352, Met 522, Phe 518 und Ser 353 wurden als die meisten beteiligten Reste für die Bildung des oben genannten Komplexes bestimmt. Um den Andockraum zu definieren, haben wir für jedes Zielprotein ein Gitterfeld erstellt. Für ADORA1 lauten die Rasterfeldwerte x-Mitte = 103,962, y-Mitte = 128,898, z-Mitte = 44,237 und x-Punkte = 54, y-Punkte = 48 und z-Punkte = 58. Für PTGS2 die Mitte Das Gitterfeld ist mit 40,049, 51,442 und 69,613 als X-, Y- bzw. Z-Koordinaten definiert, und die Gitterpunkte waren 56, 60 und 63 in X-, Y- und Z-Koordinaten. Außerdem wurde der Gitterpunktabstand für beide auf 0,375 Angström eingestellt. Schließlich wurden Docking-Studien von AutoDock 4.2 unter Verwendung des Lamarckschen genetischen Algorithmus durchgeführt.

Um den experimentellen Raum einzuschränken, der für die Entdeckung eines neuen therapeutischen Wirkstoffs erforderlich ist, schlägt diese Studie zwei innovative Rechenmodelle namens IEDTI und DEDTI vor. Sie können bei der Identifizierung neuer DTIs helfen, indem sie heterogene Informationen über Medikamente und Targets einbeziehen. IEDTI- und DEDTI-Szenarien nutzen die Arzneimittel-Ziel-Wechselwirkungen als Vorhersageetikett. Als Übersicht (Abb. 1 und 2) sind IEDTI bzw. DEDTI dargestellt. Beide Modelle extrahieren vier Arten von Ähnlichkeiten zwischen Arzneimitteln und drei Arten von Ähnlichkeiten für Ziele. Beide Szenarien manipulieren die kumulative Version von Medikamenten und Zielen als Eingaben. IEDTI besteht aus drei CNN-Modulen. Das erste und das zweite Modul generieren die Einbettungsvektoren von Arzneimitteln bzw. Zielen. Somit sind ihre Eingaben Merkmalsvektoren aus der Akkumulation von Ähnlichkeitsmatrizen und ihre Ausgaben sind neue Einbettungsvektoren. Um eine sinnvolle Generierung von Einbettungen zu erreichen, wird eine Clustering-Methode auf die Akkumulationsmatrizen angewendet. Die Clusterbildung hilft bei der Identifizierung von Arzneimittelbezeichnungen und Zielmolekülen. Die DNN-Module generieren ähnliche Einbettungsvektoren für Eingaben mit derselben Bezeichnung. Das dritte Modul identifiziert die Interaktion jedes Medikament-Ziel-Paares. Somit ist seine Eingabe die Verkettung neuer Einbettungsvektoren von Arzneimittel-Ziel-Paaren und seine Ausgabe ist ein binärer Wert, der das Vorhandensein oder Fehlen einer Interaktion anzeigt. DEDTI hingegen besteht nur aus einem einzigen DNN-Modul. Die Eingaben dieses Moduls sind direkt akkumulierte Ähnlichkeitsmatrizen jedes untersuchten Arzneimittel-Ziel-Paares, und die Ausgabe ist deren Interaktionskennung. Im Abschnitt „Methoden“ werden beide Szenarien ausführlich beschrieben.

Die Vorhersageleistung unserer Modelle wurde mithilfe eines zehnfachen Kreuzvalidierungsverfahrens bewertet. Wir haben den Datensatz in Test- und Trainingssätze unterteilt, wobei \(10\%\) des Datensatzes als Testsatz und die restlichen \(90\%\) als Trainingssatz verwendet wurden. Anschließend verglichen wir unsere Ergebnisse mit den Ergebnissen von fünf hochmodernen Methoden zur DTI-Vorhersage, darunter HIDTI22 und NeoDTI20, MolTrans23, TransDTI24 und IMCHGAN41. Aufgrund des Datenungleichgewichts bei positiven und negativen DTI-Proben berichten wir außerdem über die Ergebnisse mit positiven zu negativen Verhältnissen von 1:3 und 1:5, wie in der Literatur üblich22. Die Tabellen 2 und 3 veranschaulichen die Ergebnisse für diese beiden Stichprobenverhältnisse. Wir vergleichen die Ergebnisse basierend auf AUC-ROC und AUPR, Präzision, Rückruf, F1-Score und MCC. AUPR, F1-Score und MCC sind insbesondere dann aufschlussreich, wenn ein Verhältnisungleichgewicht zwischen positiven und negativen Proben besteht. IEDTI hat im Vergleich zu den HIDTI-Modellen und NeoDTI einen höheren AUC-ROC. Das HIDTI-einfache Format hat einen höheren AUPR in den Verhältnissen 1:3 und 1:5 als IEDTI. Allerdings ist die Standardabweichung von HIDTI-Modellen und NeoDTI viel höher als die von IEDTI. Mit anderen Worten: IEDTI weist geringere Schwankungen beim Erkennen verschiedener Falten auf. Noch wichtiger ist, dass DEDTI, wie die Tabelle zeigt, über alle Methoden hinweg die beste AUPR und AUC-ROC mit geringfügigen Schwankungen bei allen Verhältnissen und in beiden Metriken bietet. Die Ergebnisse zeigen, dass IEDTI und DEDETI, insbesondere letzteres, bei der Vorhersage von DTIs gut abschneiden. Die Abbildungen 3a–f zeigen die ROC- und PR-Diagramme von IEDTI und DEDTI für alle Verhältnisse 1:1, 1:3 und 1:5. Es ist erwähnenswert, dass das Gleiche auch für die IEDTI- und DEDTI-Methoden für das Verhältnis 1:10 gilt.

PR- und ROC-Kurven verschiedener Stichprobenverhältnisse aus dem DTINet-Datensatz.

Die t-NSE-Darstellungen von Arzneimitteln und Zielen im DTINet-Datensatz. Die linken Abbildungen zeigen die Darstellungen von Medikamenten und Zielen nach Anwendung der k-Mittel. Wie die Zahlen zeigen, sind die Klassen nicht vollständig entkoppelt; Durch die Anwendung der Triplett-Module werden jedoch sowohl Medikamente als auch Ziele vollständig voneinander getrennt (rechte Abbildungen).

Wir wenden DEDTI, IMCHGAN, AutoDTI++ und IRNMF auf Goldstandard-Datensätze31 (Enzym-, Ionenkanal-, GPCR- und Kernrezeptor-Datensätze) an. Ihre AUC-ROC- und AUPR-Balkendiagramme sind in Abb. 5 dargestellt. Wie die Ergebnisse zeigen, stehen IMCHGAN und DEDTI bei Goldstandard-Datensätzen in einem harten Wettbewerb. Während IMCHGAN den höchsten AUC-ROC bei GPCR und Kernrezeptoren aufweist, weist DEDTI den höchsten AUC-ROC bei Enzym- und Ionenkanal-Datensätzen auf. Darüber hinaus zeigt das Balkendiagramm, dass der DEDTI in drei von vier Benchmarks den höchsten AUPR aufweist. Darüber hinaus zeigt Tabelle 4 den Vergleich von DEDTI, TransDTI, MolTrans, TransforerCPI, DeepConvDTI und DeepDTA in Goldstandard-Datensätzen. Der DEDTI ist in allen Fällen bis auf zwei der Gewinner.

Leistungsvergleich zwischen DEDTI mit IRNMF, AutoDTI++ und IMCHGAN anhand der Goldstandard-Datensätze31. AUC-ROC- und AUPR-Balkendiagramme.

Unser Modell nutzt die Informationen aus akkumulativen Ähnlichkeiten, um die neuartigen Wechselwirkungen zwischen Arzneimitteln und Zielen vorherzusagen (Ergänzungsdaten 1). Wir haben DTIs mit einem Vorhersagewert von mindestens 0,9 als die am besten bewerteten Vorschläge von DEDTI ausgewählt. Unter den 126 am höchsten bewerteten Vorhersagen (Abb. 6) haben wir herausgefunden, dass viele von ihnen durch wissenschaftliche Beweise aus der Literatur überprüfbar sind. Unsere Vorhersageliste zeigt beispielsweise die Wechselwirkung zwischen Fentanyl und dem D2-Dopaminrezeptor (DRD2), und diese Vorhersage kann durch frühere Studien gestützt werden42.

Allerdings gibt es in der Liste der 126 besten Vorhersagen von DEDTI einige neuartige Wechselwirkungen, die in der Literatur weniger Beachtung finden. Zwei dieser Wechselwirkungen sind beispielsweise Tetrabenazin-Adenosin-Rezeptor A1 (ADORA1) und Chlorzoxazon-Prostaglandin-Endoperoxid-Synthase 2 (PTGS2). Der Adenosinrezeptor A1 bildet zusammen mit vier anderen Rezeptoren eine definierte Untergruppe der G-Protein-gekoppelten Rezeptoren43. Dieses Protein ist im gesamten menschlichen Körper verteilt und reguliert die Nierenfunktion44. Darüber hinaus zeigen neuere Studien, dass der Abbau von ADORA1 in den menschlichen Melanomzelllinien die Zellproliferation deutlich unterdrückt, und diese Unterdrückung führt zu einer Antitumorwirkung45. Obwohl es laut der KEGG-Datenbank46 25 zugelassene Medikamente gibt, die ADORA1 beeinflussen, wird das von DEDTI vorhergesagte Medikament (Tetrabenazin) in dieser Liste nicht erwähnt. Tetrabenazin ist als Dopamin-abbauendes Mittel bekannt, das zur Behandlung von Schizophrenie entwickelt wurde. Darüber hinaus haben viele Studien gezeigt, dass dieses Medikament bei der Behandlung von psychotischen Störungen und hyperkinetischen Bewegungsstörungen wirksam sein könnte47. Prostaglandin-Endoperoxid-Synthase 2 (PTGS2), auch bekannt als Cyclooxygenase 2 (COX-2), ist für die Prostaglandinproduktion verantwortlich und trägt zur Frühschwangerschaft bei48. Darüber hinaus wurde über zahlreiche Studien zur Rolle von PTGS2 bei der Pathogenese vieler Krankheiten wie Entzündungen, Herz-Kreislauf-, Magen-Darm- und Darmkrebs berichtet49. Als Hemmer für dieses Enzym werden häufig nichtsteroidale entzündungshemmende Medikamente (NSAIDs) eingesetzt50. Chlorzoxazon ist ein von der FDA zugelassenes Muskelrelaxans, das auch von DEDTI als potenzielles Medikament für eine Wechselwirkung mit PTGS2 vorhergesagt wurde. Trotz der Verfügbarkeit zugelassener Arzneimittel für diese beiden oben genannten Ziele ist die Identifizierung eines neuen Arzneimittels aus bereits zugelassenen Arzneimitteln immer von großer Bedeutung. Daher wäre es spannend zu prüfen, ob die vorhergesagten Wechselwirkungen zwischen diesen beiden Medikamenten und Zielen weiter validiert werden können.

Es wurden molekulare Docking-Studien durchgeführt, um die möglichen Wechselwirkungen zwischen Chlorzoxazon und Tetrabenazin im Komplex mit PTGS2 bzw. ADORA1 zu analysieren. Die erhaltenen Konformationen wurden basierend auf den Konformationsähnlichkeiten und der quadratischen Mittelwert-Positionsabweichung (RMSD)51 gruppiert. Anschließend wurde für jedes Ziel die beste Pose mit der niedrigsten Bindungsenergie (\(\Delta G\)) ausgewählt. Zur Untersuchung der intermolekularen Wechselwirkungskräfte wurden die Docking-Ergebnisse mit dem Biovia Discovery Studio Visualizer52 visualisiert. Die freien Bindungsenergien von Chlorzoxazon und Tetrabenazin im Komplex mit PTGS2 und ADORA1 sind in Tabelle 5 aufgeführt. Beide vorhergesagten Arzneimittel binden mit akzeptablen Bindungsaffinitäten und in der richtigen Position an ihr Ziel. Chlorzoxazon bindet an PTGS2, indem es eine Wasserstoffbrücke mit Ser 530 und andere Wechselwirkungen mit Val 523, Leu352, Phe 518, Met 522, Gly 526, Lue 384, Phe 381, Tyr 385, Trp 387, Ala 527, Val 349 und Ser 353 bildet Abbildung 7 zeigt die 3D- und 2D-Darstellungen. Wie Abb. 8 zeigt, entsteht der Komplex aus Tetrabenazin-ADORA1 durch eine Zwischenstufe einer Wasserstoffwechselwirkung zwischen dem Wirkstoff und Asn 1359. Darüber hinaus sind weitere Aminosäuren wie Ala 1171, Ile 1174, Tyr 1376, Tyr 1117, Phe 1276 enthalten , Val 1192 und Leu 1355 waren ebenfalls an der Bildung dieses Wirkstoff-Protein-Komplexes beteiligt.

Visualisierung der 126 von DEDTI vorhergesagten Top-DTIs. Ziele werden in grünen Kreisen und Medikamente in rosa Kästchen angezeigt. Neue Wechselwirkungen zwischen Medikamenten und Zielmolekülen sind durch schwarze Ränder gekennzeichnet.

2D- und 3D-Darstellungen der angedockten Pose für die vorhergesagte Wechselwirkung zwischen Chlorzoxazon und PTGS2. Wasserstoffbrückenbindungen werden durch die grünen gestrichelten Linien dargestellt.

2D- und 3D-Darstellungen der angedockten Pose für die vorhergesagte Interaktion zwischen Tetrabenazin und ADORA1. Wasserstoffbrückenbindungen werden durch die grünen gestrichelten Linien dargestellt.

Wir haben den t-Test mit einer Fehlerquote von \(5\%\) durchgeführt, um die Signifikanz der Unterschiede in den Ergebnissen der drei Methoden IEDTI, DEDTI und IMCHGAN für alle Datensätze zu überprüfen. Hier berichten wir über die Ergebnisse zu DTI mit einem negativen Stichprobenverhältnis von 1:1, DTI mit einem negativen Stichprobenverhältnis von 1:3 und allen Goldstandard-Datensätzen. In allen Fällen lag die statistische Analyse unter der Fehlergrenze, außer im Fall des Vergleichs von DEDTI und IMCHGAN im DTI-Datensatz mit einem negativen Stichprobenverhältnis von 1:1. Mit anderen Worten: DEDTI ist in allen Fällen deutlich besser als die anderen Methoden. Eine Ausnahme bildet das Verhältnis 1:3, bei dem DEDTI und IMCHGAN die gleiche Leistung erbringen. Tabelle 6 zeigt die Ergebnisse des p-Werts.

Wir haben zwei Methoden eingeführt, IEDTI und DEDTI, die beide die Arzneimittel-Ziel-Wechselwirkungen nicht als Eingabemerkmalsinformationen, sondern als Bezeichnungen für die DTI-Vorhersage benötigen. Mit anderen Worten: Unsere Methoden sind induktiv, was im Gegensatz zu NeoDTI20 steht. NeoDTI verwendet Wirkstoff-Zielinformationen im Merkmalsraum, was bei graphischen neuronalen Netzwerkmethoden recht häufig vorkommt. Noch wichtiger ist, dass sowohl Trainings- als auch Testproben in der Trainingsphase der Methode sichtbar sind, was diese Methode transduktiv macht. Transduktive Methoden sind zur Vorhersage nicht geeignet.

IEDTI und DEDTI nutzen DNN-Module für ihre Missionen. Ersteres verwendet drei Module (zwei für die Erstellung von Einbettungen und eines für die Vorhersage), und letzteres verwendet ein Modul (das Vorhersagemodul). Abgesehen von der Anzahl der Module weisen beide im Vergleich zum Stand der Technik eine geringere Rechenkomplexität auf -Art-Methoden, z. B. HIDTI, NeoDTI und IMCHGAN. Darüber hinaus erfasst IEDTI aussagekräftige Einbettungen direkt, anstatt verfügbare und gebrauchsfertige Einbettungen zu verwenden.

Andererseits nutzt IEDTI, wie Methoden aus der Literatur wie NeoDTI und HIDTI, den Vorteil, den ursprünglichen Merkmalsraum in einen neuen entsprechenden Einbettungsraum umzuwandeln. Ziel ist eine aussagekräftige Darstellung der Daten und ein geringerer Rechenaufwand für die Vorhersage. Wir zeigen dies in der Komplexitätsanalyse im Abschnitt Methode. Allerdings hängen solche Transformationen von der Konvertierungsmethode und den gekennzeichneten Daten ab. In vielen Fällen gibt das Daten-Clustering keinen geeigneten Wert zurück. DEDTI zeigt, dass einfachere Methoden ohne den zusätzlichen Aufwand der Einbettungskonvertierung bei der DTI-Vorhersage besser abschneiden. Es sind bessere Methoden zum Einbetten von Konvertierungen erforderlich.

Darüber hinaus müssen Methoden induktiv sein, um DTIs vorhersagen zu können. Basierend auf Occams Rasiermesser ist die einfachere Methode die beste Wahl für die Daten. Auch hier liefert DEDTI eine aufschlussreiche Darstellung dieser Idee. Informationen für DTI, d. h. Arzneimittel-Ziel-Interaktionen, Arzneimittel-Arzneimittel-Interaktionen, Arzneimittel-Arzneimittel-Ähnlichkeit, Arzneimittel-Nebenwirkungs-Assoziationen, Arzneimittel-Krankheits-Assoziationen, Ziel-Ziel-Interaktionen, Ziel-Krankheits-Interaktionen, Ähnlichkeiten von Zielen. Eine weitere wichtige Beobachtung aus dieser Arbeit sind die Vorteile der Summierung ähnlicher Matrizen statt ihrer Verkettung. Durch die Konvertierung der Informationsmatrizen in die Ähnlichkeitsmatrizen werden ihre Dimensionen gleich, und diese Konvertierung bietet die Möglichkeit, die Informationen zu summieren.

Die Summation von Ähnlichkeitsmatrizen hat einen kleineren Merkmalsraum als die Verkettung. Beispielsweise hat jeder Arzneimittelvektor eine Größe von 708 im Vergleich zu anderen Methoden, bei denen die Länge des Merkmalsvektors mehr als tausend beträgt. Darüber hinaus vermeidet der prägnante Merkmalsraum die spärliche Darstellung der Merkmalsvektoren. Mit anderen Worten: Jede Arzneimittelprobe ist dichter dargestellt, was sie aussagekräftiger macht.

Die dichtere Darstellung ist ein weiterer Grund, warum DEDTI über alle Methoden hinweg die beste Leistung aufweist. Bemerkenswert ist, dass DEDTI zusätzlich zum Deep-Prediction-Netzwerk die summierten Ähnlichkeitsvektoren als Merkmalsdarstellung sowohl des Arzneimittels als auch des Ziels einbezieht. Die Verbesserung der Art der Merkmalseinbettung und die Verbesserung der induktiven Vorhersagemethode sind Elixiere der DTI-Vorhersage.

Die während der aktuellen Studie generierten und/oder analysierten Datensätze sind im IEDTI-DEDTI-Repository verfügbar, github.com/BioinformaticsIASBS/IEDTI-DEDTI.

Li, J. et al. Eine Übersicht über aktuelle Trends bei der computergestützten Neupositionierung von Arzneimitteln. Knapp. Bioinform. 17, 2–12 (2016).

PubMed Google Scholar

Truong, TT, Panizzutti, B., Kim, JH & Walder, K. Wiederverwendung von Drogen durch Netzwerkanalyse: Chancen für psychiatrische Störungen. Pharmazie 14, 1464 (2022).

PubMed PubMed Central Google Scholar

Dick, K. et al. Die reziproke Perspektive als Super-Lerner verbessert die Vorhersage der Arzneimittel-Ziel-Interaktion (musdti). Wissenschaft. Rep. 12, 1–19 (2022).

Google Scholar

Ezzat, A., Wu, M., Li, X.-L. & Kwoh, C.-K. Computergestützte Vorhersage von Arzneimittel-Ziel-Wechselwirkungen mithilfe chemogenomischer Ansätze: eine empirische Untersuchung. Knapp. Bioinform. 20, 1337–1357 (2019).

CAS PubMed Google Scholar

Najm, M., Azencott, C.-A., Playe, B. & Stoven, V. Identifizierung von Arzneimittelzielen mit maschinellem Lernen: Wie man negative Beispiele auswählt. Int. J. Mol. Wissenschaft. 22, 5118 (2021).

PubMed PubMed Central Google Scholar

Kaushik, AC, Mehmood, A., Dai, X. & Wei, D.-Q. Eine vergleichende chemogene Analyse zur Vorhersage von Wirkstoff-Ziel-Paaren mithilfe von Ansätzen des maschinellen Lernens. Wissenschaft. Rep. 10, 1–11 (2020).

Google Scholar

Jacob, L. & Vert, J.-P. Vorhersage der Protein-Ligand-Wechselwirkung: ein verbesserter Chemogenomik-Ansatz. Bioinformatik 24, 2149–2156 (2008).

CAS PubMed PubMed Central Google Scholar

Hu, L. et al. Sselm-neg: Sphärische, suchbasierte extreme Lernmaschine zur Vorhersage von Arzneimittel-Ziel-Interaktionen. BMC Bioinformatics 24, 38 (2023).

CAS PubMed PubMed Central Google Scholar

Mongia, A. & Majumdar, A. Vorhersage der Arzneimittel-Ziel-Interaktion unter Verwendung einer durch mehrere Graphen regulierten nuklearen Normminimierung. Plos One 15, e0226484 (2020).

CAS PubMed PubMed Central Google Scholar

Zhou, J., Li, Y., Huang, W., Shi, W. & Qian, H. Quelle und Untersuchung der Peptide, die zur Konstruktion von Peptid-Wirkstoff-Konjugaten verwendet werden. EUR. J. Med. Chem. 224, 113712 (2021).

CAS PubMed Google Scholar

Luo, Y. et al. Ein Netzwerkintegrationsansatz für die Vorhersage von Arzneimittel-Ziel-Interaktionen und die rechnerische Neupositionierung von Arzneimitteln anhand heterogener Informationen. Nat. Komm. 8, 1–13 (2017).

ADS Google Scholar

Caron, PR et al. Chemogenomische Ansätze zur Wirkstoffentdeckung. Curr. Meinung. Chem. Biol. 5, 464–470 (2001).

CAS PubMed Google Scholar

Playe, B. & Stoven, V. Evaluierung von Deep- und Shallow-Learning-Methoden in der Chemogenomik zur Vorhersage der Arzneimittelspezifität. J. Cheminform. 12, 11 (2020).

PubMed PubMed Central Google Scholar

Sawada, R., Kotera, M. & Yamanishi, Y. Benchmarking einer breiten Palette chemischer Deskriptoren für die Vorhersage von Arzneimittel-Ziel-Interaktionen mithilfe eines chemogenomischen Ansatzes. Mol. Informieren. 33, 719–731 (2014).

CAS PubMed Google Scholar

Sharma, A. & Rani, R. Eine systematische Übersicht über Anwendungen des maschinellen Lernens bei der Krebsvorhersage und -diagnose. Bogen. Berechnen. Methoden Eng. 28, 4875–4896 (2021).

Google Scholar

Tang, X. et al. Indikator regulierte nicht-negative Matrixfaktorisierungsmethode basierend auf der Wiederverwendung von Arzneimitteln für Covid-19. Vorderseite. Immunol. 11, 603615. https://doi.org/10.3389/fimmu.2020.603615 (2021).

CAS PubMed PubMed Central Google Scholar

Güvenç Paltun, B., Mamitsuka, H. & Kaski, S. Verbesserung der Vorhersage der Arzneimittelwirkung durch Integration mehrerer Datenquellen: Matrixfaktorisierung, Kernel- und netzwerkbasierte Ansätze. Knapp. Bioinform. 22, 346–359 (2021).

PubMed Google Scholar

Picard, M., Scott-Boyer, M.-P., Bodein, A., Périn, O. & Droit, A. Integrationsstrategien von Multi-Omics-Daten für die Analyse maschinellen Lernens. Berechnen. Struktur. Biotechnologie. J. 19, 3735–3746 (2021).

CAS PubMed PubMed Central Google Scholar

Hashemi, SM, Zabihian, A., Hooshmand, M. & Gharaghani, S. Draw: Vorhersage von antiviralen Covid-19-Medikamenten durch Deep Learning – ein Einwand gegen die Verwendung der Matrixfaktorisierung. BMC Bioinform. 24, 52 (2023).

Google Scholar

Wan, F., Hong, L., Xiao, A., Jiang, T. & Zeng, J. Neodti: Neuronale Integration von Nachbarinformationen aus einem heterogenen Netzwerk zur Entdeckung neuer Arzneimittel-Ziel-Interaktionen. Bioinformatik 35, 104–111 (2019).

CAS PubMed Google Scholar

Sajadi, SZ, Zare Chahooki, MA, Gharaghani, S. & Abbasi, K. Autodti++: Deep Unsupervised Learning für die DTI-Vorhersage durch Autoencoder. BMC Bioinform. 22, 1–19 (2021).

Soh, J., Park, S. & Lee, H. Hidti: Integration heterogener Informationen zur Vorhersage von Arzneimittel-Ziel-Interaktionen. Wissenschaft. Rep. 12, 1–12 (2022).

Google Scholar

Huang, K., Xiao, C., Glass, LM & Sun, J. MolTrans: Molekularer Interaktionstransformator für die Vorhersage von Arzneimittel-Ziel-Interaktionen. Bioinformatik 37, 830–836 (2021).

CAS PubMed Google Scholar

Kalakoti, Y., Yadav, S. & Sundar, D. TransDTI: Transformer-basierte Sprachmodelle zur Schätzung von DTIs und zum Aufbau eines Arbeitsablaufs für Arzneimittelempfehlungen. ACS Omega 7, 2706–2717 (2022).

CAS PubMed PubMed Central Google Scholar

Senior, AW et al. Verbesserte Vorhersage der Proteinstruktur mithilfe von Potenzialen aus Deep Learning. Natur 577, 706–710. https://doi.org/10.1038/s41586-019-1923-7 (2020).

ADS CAS PubMed Google Scholar

Knox, C. et al. Drugbank 3.0: Eine umfassende Ressource für die „Omics“-Forschung zu Arzneimitteln. Nukleinsäuren Res. 39, D1035–D1041 (2010).

PubMed PubMed Central Google Scholar

Keshava Prasad, T. et al. Aktualisierung der Referenzdatenbank für menschliche Proteine ​​– 2009. Nukleinsäuren Res. 37, D767–D772 (2009).

CAS PubMed Google Scholar

Davis, AP et al. Die vergleichende Toxikogenomik-Datenbank: Update 2013. Nucleic Acids Res. 41, D1104–D1114 (2013).

ADS CAS PubMed Google Scholar

Kuhn, M., Campillos, M., Letunic, I., Jensen, LJ & Bork, P. Eine Ressource zu Nebenwirkungen, um phänotypische Wirkungen von Arzneimitteln zu erfassen. Mol. Syst. Biol. 6, 343 (2010).

PubMed PubMed Central Google Scholar

Xuan, P., Chen, B., Zhang, T. et al. Vorhersage von Arzneimittel-Ziel-Interaktionen basierend auf Netzwerkrepräsentationslernen und Ensemblelernen. In IEEE/ACM Transactions on Computational Biology and Bioinformatics (2020).

Yamanishi, Y., Araki, M., Gutteridge, A., Honda, W. & Kanehisa, M. Vorhersage von Arzneimittel-Ziel-Interaktionsnetzwerken aus der Integration chemischer und genomischer Räume. Bioinformatik 24, i232–i240 (2008).

CAS PubMed PubMed Central Google Scholar

Han, J. & Kamber, M. Data Mining: Konzepte und Techniken. Morgan Kaufmann 340, 94104–3205 (2006).

MATH Google Scholar

Yuan, S.-T. & Sun, J. Ontologiebasierte strukturierte Kosinusähnlichkeit bei der Zusammenfassung von Sprachdokumenten. In IEEE/WIC/ACM International Conference on Web Intelligence (WI'04), 508–513 (IEEE, 2004).

Singh, RH, Maurya, S., Tripathi, T., Narula, T. & Srivastav, G. Filmempfehlungssystem unter Verwendung von Kosinusähnlichkeit und knn. Int. J. Eng. Adv. Technol. 9, 556–559 (2020).

Google Scholar

Bordes, A., Usunier, N., Garcia-Duran, A., Weston, J. & Yakhnenko, O. Übersetzen von Einbettungen zur Modellierung multirelationaler Daten. Adv. Neuronale Inf. Verfahren. Syst. 26 (2013).

Chicco, D. & Jurman, G. Die Vorteile des Matthews-Korrelationskoeffizienten (mcc) gegenüber dem f1-Score und der Genauigkeit bei der binären Klassifizierungsbewertung. BMC-Genom. 21, 6. https://doi.org/10.1186/s12864-019-6413-7 (2020).

Google Scholar

Berman, HM et al. Die Proteindatenbank. Nukleinsäuren Res. 28, 235–242. https://doi.org/10.1093/nar/28.1.235 (2000).

ADS CAS PubMed PubMed Central Google Scholar

Kim, S. et al. PubChem im Jahr 2021: Neue Dateninhalte und verbesserte Weboberflächen. Nukleinsäuren Res. 49, D1388–D1395. https://doi.org/10.1093/nar/gkaa971 (2020).

CAS PubMed Central Google Scholar

Guex, N. & Peitsch, MC SWISS-MODEL und der Swiss-PdbViewer: Eine Umgebung für vergleichende Proteinmodellierung. Electrophoresis 18, 2714–2723 (1997).

CAS PubMed Google Scholar

Laskowski, RA & Swindells, MB Ligplot+: Multiple Ligand-Protein-Interaktionsdiagramme für die Arzneimittelentwicklung. J. Chem. Inf. Modell. 51, 2778–2786. https://doi.org/10.1021/CI200227U (2011).

CAS PubMed Google Scholar

Li, J., Wang, J., Lv, H., Zhang, Z. & Wang, Z. IMCHGAN: Induktive Matrixvervollständigung mit heterogenen Graph-Aufmerksamkeitsnetzwerken für die Vorhersage von Arzneimittel-Ziel-Interaktionen. IEEE/ACM-Trans. Berechnen. Biol. Bioinform. 19, 655–665 (2022).

CAS PubMed Google Scholar

Lipiński, PFJ & Matalińska, J. Fentanylstruktur als Gerüst für Opioid-/Nicht-Opioid-Multitarget-Analgetika. Int. J. Mol. Wissenschaft. 23, https://doi.org/10.3390/ijms23052766 (2022).

Fredholm, BB Adenosinrezeptoren als Angriffspunkte für Medikamente. Exp. Zellauflösung 316, 1284–1288 (2010).

CAS PubMed PubMed Central Google Scholar

Hocher, B. Adenosin-A1-Rezeptorantagonisten in der klinischen Forschung und Entwicklung. Niere Int. 78, 438–445 (2010).

CAS PubMed Google Scholar

Liu, H. et al. Die Adora1-Hemmung fördert die Tumorimmunevasion durch Regulierung der atf3-pd-l1-Achse. Krebszelle 37, 324-339.e8. https://doi.org/10.1016/j.ccell.2020.02.006 (2020).

CAS PubMed Google Scholar

Kanehisa, M. & Goto, S. Kegg: Kyoto-Enzyklopädie der Gene und Genome. Nukleinsäuren Res. 28, 27–30 (2000).

CAS PubMed PubMed Central Google Scholar

Kenney, C. & Jankovic, J. Tetrabenazin bei der Behandlung hyperkinetischer Bewegungsstörungen. Experte Rev. Neurother. 6, 7–17 (2006).

CAS PubMed Google Scholar

Anamthathmakula, P. & Winuthayanon, W. Prostaglandin-Endoperoxid-Synthase 2 (PTGS2) im Eileiter: Rollen bei der Befruchtung und der frühen Embryonalentwicklung. Endokrinologie 162 (2021).

Jaén, RI, Prieto, P., Casado, M., Martín-Sanz, P. & Boscá, L. Posttranslationale Modifikationen der Prostaglandin-Endoperoxid-Synthase 2 bei Darmkrebs: Ein Update. Welt J. Gastroenterol. 24, 5454–5461 (2018).

PubMed PubMed Central Google Scholar

Rao, PP & Knaus, EE Entwicklung nichtsteroidaler entzündungshemmender Medikamente (NSAIDs): Cyclooxygenase (Cox)-Hemmung und darüber hinaus. J. Pharm. Pharm. Wissenschaft. Veröffentlichungskan. Soc. Pharm. Wissenschaft. Societe canadienne des sciences pharmaceutiques 11(2), 81s–110s (2008).

Google Scholar

Iman, M., Saadabadi, A. & Davood, A. (2013). Docking-Studien zum Phthalimid-Pharmakophor als Natriumkanalblocker. Iran. J. Basic Med. Wissenschaft. 16, 1016–1021. https://doi.org/10.22038/ijbms.2013.1684

Systems, D. Biovia, Discovery Studio Visualizer, Veröffentlichung 2019 (Dassault Systems, San Diego, 2020).

Google Scholar

Referenzen herunterladen

Die Autoren danken Alireza Abdi für seine Hilfe bei der Vorbereitung der Testanalyse.

Labor für Bioinformatik und Arzneimitteldesign (LBD), Institut für Biochemie und Biophysik, Universität Teheran, Teheran, Iran

Arash Zabihian und Sajjad Gharaghani

Abteilung für Informatik und Informationstechnologie, Institut für fortgeschrittene Studien in den Grundlagenwissenschaften (IASBS), Zanjan, Iran

Faeze Zakaryapour Sayyad, Seyyed Morteza Hashemi, Reza Shami Tanha und Mohsen Hooshmand

Abteilung für Bioinformatik, Kish International Campus, Universität Teheran, Kish, Iran

Arash Zabihian

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

AZ, MH und FZS konzipierten die Idee. ZGF und SMH implementierten die Methoden und bereiteten die Ergebnisse auf. RS hat die IMCHGAN-Methode aktualisiert und vorbereitet. AZ, MH und FZS haben den Artikel verfasst. MH, AZ, FZS und SG haben das Manuskript überprüft.

Korrespondenz mit Mohsen Hooshmand oder Sajjad Gharaghani.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Zabihian, A., Sayyad, FZ, Hashemi, SM et al. DEDTI versus IEDTI: effiziente und prädiktive Modelle für Arzneimittel-Ziel-Wechselwirkungen. Sci Rep 13, 9238 (2023). https://doi.org/10.1038/s41598-023-36438-0

Zitat herunterladen

Eingegangen: 27. Februar 2023

Angenommen: 03. Juni 2023

Veröffentlicht: 07. Juni 2023

DOI: https://doi.org/10.1038/s41598-023-36438-0

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.