Methoden des maschinellen Lernens für quantitative radiomische Biomarker

Nachricht

HeimHeim / Nachricht / Methoden des maschinellen Lernens für quantitative radiomische Biomarker

Oct 13, 2023

Methoden des maschinellen Lernens für quantitative radiomische Biomarker

Wissenschaftliche Berichte Band 5,

Scientific Reports Band 5, Artikelnummer: 13087 (2015) Diesen Artikel zitieren

34.000 Zugriffe

600 Zitate

16 Altmetrisch

Details zu den Metriken

Radiomics extrahiert und analysiert eine große Anzahl medizinischer Bildgebungsmerkmale, um die phänotypischen Eigenschaften von Tumoren zu quantifizieren. Hochpräzise und zuverlässige Ansätze des maschinellen Lernens können den Erfolg radiomischer Anwendungen in der klinischen Versorgung vorantreiben. In dieser Radiomic-Studie wurden vierzehn Merkmalsauswahlmethoden und zwölf Klassifizierungsmethoden hinsichtlich ihrer Leistungsfähigkeit und Stabilität zur Vorhersage des Gesamtüberlebens untersucht. Aus Computertomographiebildern (CT) von 464 Lungenkrebspatienten vor der Behandlung wurden insgesamt 440 radiomische Merkmale extrahiert. Um eine unvoreingenommene Bewertung verschiedener Methoden des maschinellen Lernens sicherzustellen, wurden öffentlich verfügbare Implementierungen zusammen mit gemeldeten Parameterkonfigurationen verwendet. Darüber hinaus verwendeten wir zwei unabhängige radiomische Kohorten für das Training (n = 310 Patienten) und die Validierung (n = 154 Patienten). Wir haben festgestellt, dass die auf dem Wilcoxon-Test basierende Merkmalsauswahlmethode WLCX (Stabilität = 0,84 ± 0,05, AUC = 0,65 ± 0,02) und die Klassifizierungsmethode Random Forest RF (RSD = 3,52 %, AUC = 0,66 ± 0,03) die höchste prognostische Leistung bei hoher Stabilität gegenüber hatten Datenstörung. Unsere Variabilitätsanalyse ergab, dass die Wahl der Klassifizierungsmethode die wichtigste Quelle für Leistungsschwankungen ist (34,21 % der Gesamtvarianz). Die Identifizierung optimaler maschineller Lernmethoden für radiomische Anwendungen ist ein entscheidender Schritt hin zu stabilen und klinisch relevanten radiomischen Biomarkern und bietet eine nicht-invasive Möglichkeit zur Quantifizierung und Überwachung tumorphänotypischer Merkmale in der klinischen Praxis.

„Präzisionsonkologie“ bezieht sich auf die maßgeschneiderte Krebsbehandlung, bei der Praktiken und/oder Therapien auf den einzelnen Patienten zugeschnitten werden. Ein solcher Anpassungsprozess kann den Erfolg präventiver und therapeutischer Interventionen mit minimalen Nebenwirkungen maximieren. Der Großteil der präzisionsonkologischen Forschung konzentriert sich auf die molekulare Charakterisierung von Tumoren mithilfe genomischer Ansätze, die eine Gewebeextraktion durch Tumorbiopsien erfordern. Obwohl in der klinischen Onkologie mehrere auf der Genomik basierende Ansätze erfolgreich angewendet wurden1, gibt es bei biopsiebasierten Tests inhärente Einschränkungen. Tumore sind räumlich und zeitlich heterogen und häufig sind wiederholte Tumorbiopsien erforderlich, die das Risiko für einen Patienten erhöhen, um die molekulare Heterogenität von Tumoren zu erfassen. Diese ethischen und klinischen Herausforderungen im Zusammenhang mit biopsiebasierten Tests können durch medizinische Bildgebung angegangen werden, die in der klinischen Onkologie eine Routinepraxis für die Krebsdiagnose und das Staging darstellt. Im Gegensatz zu Biopsien ist die medizinische Bildgebung nicht-invasiv und kann Informationen über den gesamten Tumorphänotyp, einschließlich der Heterogenität innerhalb des Tumors, liefern. Darüber hinaus ermöglichen jüngste Fortschritte bei hochauflösenden Bilderfassungsgeräten und Computerhardware die detaillierte und effiziente Quantifizierung der phänotypischen Eigenschaften von Tumoren. Daher bietet die medizinische Bildgebung beispiellose Möglichkeiten für die Präzisionsonkologie.

„Radiomics“, ein aufstrebendes und vielversprechendes Gebiet, geht davon aus, dass die medizinische Bildgebung wichtige Informationen zur Tumorphysiologie liefert, die zur Verbesserung der Krebsdiagnostik genutzt werden könnten2. Es ermöglicht eine umfassende Quantifizierung von Tumorphänotypen durch Extrahieren und Auswerten einer großen Anzahl quantitativer Bildgebungsmerkmale3. Mehrere Studien haben verschiedene radiomische Merkmale im Hinblick auf ihre prognostischen oder prädiktiven Fähigkeiten und Zuverlässigkeit in verschiedenen klinischen Situationen untersucht4,5,6,7,8,9,10. Verschiedene Studien haben die Unterscheidungsfähigkeit radiomischer Merkmale für die Stratifizierung der Tumorhistologie6, der Tumorgrade oder -stadien11 und der klinischen Ergebnisse8,12,13 gezeigt. Darüber hinaus haben einige Studien über den Zusammenhang zwischen radiomischen Merkmalen und den zugrunde liegenden Genexpressionsmustern berichtet8,14,15.

„Maschinelles Lernen“ kann im weitesten Sinne als rechnerische Methoden/Modelle definiert werden, die Erfahrungen (Daten) nutzen, um die Leistung zu verbessern oder genaue Vorhersagen zu treffen16. Diese programmierbaren Rechenmethoden sind in der Lage, aus Daten zu „lernen“ und können somit den Vorhersageprozess automatisieren und verbessern. Prädiktive und prognostische Modelle mit hoher Genauigkeit, Zuverlässigkeit und Effizienz sind entscheidende Faktoren für den Erfolg der Radiomics. Daher ist es wichtig, verschiedene Modelle des maschinellen Lernens für auf Radiomics basierende klinische Biomarker zu vergleichen. Wie jedes Hochdurchsatz-Data-Mining-Gebiet unterliegt auch die Radiomics dem Fluch der Dimensionalität17, dem durch geeignete Strategien zur Merkmalsauswahl begegnet werden sollte. Darüber hinaus trägt die Merkmalsauswahl auch dazu bei, die Überanpassung von Modellen zu reduzieren (und die Generalisierbarkeit zu erhöhen). Um die Dimensionalität des Radiomic-Merkmalsraums zu reduzieren und die Leistung von auf Radiomics basierenden Vorhersagemodellen zu verbessern, sollten daher verschiedene Methoden zur Merkmalsauswahl18 gründlich untersucht werden. Da Radiomics jedoch ein aufstrebendes Forschungsgebiet ist, haben die meisten veröffentlichten Studien nur die Vorhersagefähigkeiten radiomischer Merkmale bewertet, ohne großen Wert auf den Vergleich verschiedener Methoden zur Merkmalsauswahl und Vorhersagemodellierung zu legen. Nur wenige neuere Studien haben die Auswirkung unterschiedlicher Merkmalsauswahl- und maschineller Lernklassifizierungsmethoden auf Radiomics-basierte klinische Vorhersagen untersucht19,20, jedoch mit begrenzten Stichprobengrößen. Darüber hinaus fehlte diesen Studien eine unabhängige Validierung der Ergebnisse, was die Generalisierbarkeit ihrer Schlussfolgerungen einschränken könnte.

In dieser Studie untersuchten wir eine große Anzahl maschineller Lernansätze für die auf Radiomics basierende Überlebensvorhersage. Wir haben 14 Merkmalsauswahlmethoden und 12 Klassifizierungsmethoden hinsichtlich ihrer Vorhersageleistung und Stabilität gegenüber Datenstörungen bewertet. Diese Methoden wurden aufgrund ihrer Beliebtheit in der Literatur ausgewählt. Darüber hinaus wurden in der Analyse öffentlich verfügbare Implementierungen zusammen mit gemeldeten Parameterkonfigurationen verwendet, was eine unvoreingenommene Bewertung dieser Methoden gewährleistete. Für das Training und die Validierung wurden zwei unabhängige Lungenkrebskohorten mit insgesamt Bild- und klinischen Ergebnisdaten von 464 Patienten verwendet. Merkmalsauswahl und prädiktive Modellierung gelten als wichtige Bausteine ​​für datengesteuerte Radiomics mit hohem Durchsatz. Daher könnte unsere Untersuchung bei der Identifizierung optimaler maschineller Lernansätze für Radiomics-basierte Vorhersagestudien helfen, die die Anwendungen nicht-invasiver und kosteneffektiver Radiomics in der klinischen Onkologie verbessern könnten.

Bei der Analyse wurden insgesamt 440 radiomische Merkmale verwendet. Diese radiomischen Merkmale quantifizierten die phänotypischen Merkmale des Tumors auf CT-Bildern und sind in vier Merkmalsgruppen unterteilt: I) Tumorintensität, II) Form, III) Textur und IV) Wavelet-Merkmale. Auf der Tumorintensität basierende Merkmale schätzten die Statistiken erster Ordnung des Intensitätshistogramms, während Formmerkmale die geometrischen 3D-Eigenschaften des Tumors beschrieben. Texturmerkmale, die aus dem gleichzeitigen Auftreten von Graustufen (GLCM)21 und Lauflängenmatrizen (GLRLM)22 abgeleitet wurden, quantifizierten die Heterogenität innerhalb des Tumors. Diese Strukturmerkmale wurden durch Mittelung ihrer Werte über alle dreizehn Richtungen berechnet. Wavelet-Merkmale sind die transformierten Domänendarstellungen der Intensitäts- und Texturmerkmale. Diese Merkmale wurden anhand verschiedener Wavelet-Zerlegungen des Originalbilds mithilfe einer Coiflet-Wavelet-Transformation berechnet. Für die Bildanalyse wurde Matlab R2012b (The Mathworks, Natick, MA) verwendet. Radiomic-Merkmale wurden automatisch von unserer selbst entwickelten Radiomics-Bildanalysesoftware extrahiert, die eine angepasste Version von CERR (Computational Environment for Radiotherapy Research)23 und Matlab für die Vorverarbeitung medizinischer Bilder verwendet. Mathematische Definitionen aller radiomischen Merkmale sowie die Extraktionsmethoden wurden bereits beschrieben8.

In dieser Studie beschäftigten wir zwei NSCLC-Kohorten aus zwei verschiedenen Instituten in den Niederlanden: (1) Lunge1:422 NSCLC-Patienten, behandelt in der MAASTRO-Klinik in Maastricht. (2) Lunge2:225 NSCLC-Patienten, behandelt am Radboud University Medical Center in Nijmegen. Für alle eingeschlossenen Patienten standen CT-Scans, manuelle Abgrenzungen und klinische Daten zur Verfügung. Weitere Einzelheiten zu den enthaltenen Datensätzen finden Sie in Supplementary-A. Wir haben die zensierten kontinuierlichen Überlebensdaten unter Verwendung einer Cutoff-Zeit von 2 Jahren dichotomisiert. Die Patienten, die über die Cutoff-Zeit hinaus lebten, wurden mit 1 gekennzeichnet, während die Verstorbenen mit 0 gekennzeichnet wurden. Das Ziel der Studie bestand darin, die Patienten in diese beiden gekennzeichneten Überlebensklassen einzuteilen. Zwei Jahre gelten als relevante Überlebenszeit für NSCLC-Patienten und mehrere andere Studien haben ihre Vorhersagemodelle unter Verwendung eines Überlebens-Cutoffs von 2 Jahren entworfen24,25,26. Wir haben die Patienten ausgeschlossen, die weniger als 2 Jahre lang beobachtet wurden. Daraus ergaben sich 310 Patienten in der Trainingskohorte (Lunge1) und 154 Patienten in der Validierungskohorte (Lung2). Alle Merkmale wurden mithilfe der Z-Score-Normalisierung normalisiert.

In der Analyse wurden vierzehn auf Filteransätzen basierende Methoden zur Merkmalsauswahl verwendet (Fisher-Score (FSCR), Relief (RELF), T-Score (TSCR), Chi-Quadrat (CHSQ), Wilcoxon (WLCX), Gini-Index (GINI). Mutual Information Maximization (MIM), Mutual Information Feature Selection (MIFS), Minimum Redundancy Maximum Relevance (MRMR), Conditional Infomax Feature Extraction (CIFE), Joint Mutual Information (JMI), Conditional Mutual Information Maximization (CMIM), Interaction Capping (ICAP). ), Doppelte symmetrische Relevanz (DISR)). Um die Lesbarkeit dieses Manuskripts zu verbessern, haben wir in Tabelle 1 alle Akronyme im Zusammenhang mit Merkmalsauswahlmethoden definiert. Wir haben diese Methoden hauptsächlich aufgrund ihrer Beliebtheit in der Literatur, ihrer Einfachheit und Recheneffizienz ausgewählt. Darüber hinaus standen für diese Methoden leicht öffentlich verfügbare Implementierungen27,28 zur Verfügung, was ihre Wiederverwendbarkeit erhöht. Filtermethoden sind Feature-Ranking-Methoden, die die Features anhand eines Bewertungskriteriums einordnen. Alle filterbasierten Methoden zur Merkmalsauswahl können in zwei Kategorien unterteilt werden: univariate Methoden und multivariate Methoden. Bei univariaten Methoden hängt das Bewertungskriterium nur von der Merkmalsrelevanz ab und ignoriert die Merkmalsredundanz, während bei multivariaten Methoden die multivariate Interaktion innerhalb der Merkmale untersucht wird und das Bewertungskriterium eine gewichtete Summe aus Merkmalsrelevanz und Redundanz ist. Die Merkmalsrelevanz ist ein Maß für die Zuordnung des Merkmals zur Ziel-/Ergebnisvariablen, während die Merkmalsredundanz das Ausmaß der Redundanz ist, die in einem bestimmten Merkmal in Bezug auf den Satz bereits ausgewählter Merkmale vorhanden ist. Weitere Beschreibungen zur theoretischen Formulierung des Merkmalsauswahlproblems und zu den einzelnen verwendeten Merkmalsauswahlmethoden finden Sie online in Supplementary-B.

Beim maschinellen Lernen wird die Klassifizierung als überwachte Lernaufgabe betrachtet, bei der aus gekennzeichneten Trainingsdaten eine Funktion abgeleitet wird16. Die Trainingsdaten bestehen aus einer Reihe von Beispielen, wobei jedes Beispiel als Paar aus einem Eingabevektor (Merkmale) und einem gewünschten Ausgabewert (Ziel- oder Kategoriebezeichnung) dargestellt wird. Der Klassifizierungsalgorithmus (Klassifikator) analysiert die Trainingsdaten und leitet eine Hypothese (Funktion) ab, die zur Vorhersage der Bezeichnungen unsichtbarer Beobachtungen verwendet werden kann. In der Literatur zum maschinellen Lernen wurden viele Klassifikatoren aus verschiedenen Bereichen der Informatik und Statistik vorgeschlagen29. In unserer Studie haben wir 12 Klassifikatoren für maschinelles Lernen verwendet, die aus 12 Klassifikatorfamilien stammen (Bagging (BAG), Bayesian (BY), Boosting (BST), Entscheidungsbäume (DT), Diskriminanzanalyse (DA), verallgemeinerte lineare Modelle (GLM). , Multiple adaptive Regression Splines (MARS), Nearest Neighbors (NN), Neuronale Netze (Nnet), Partielle Least-Square- und Hauptkomponentenregression (PLSR), Random Forests (RF) und Support Vector Machines (SVM)). Die mit Klassifikatoren verbundenen Akronyme sind in Tabelle 1 definiert. Alle Klassifikatoren wurden mit dem R-Paket caret30 implementiert, das eine schöne Schnittstelle für den Zugriff auf viele maschinelle Lernalgorithmen in R bietet. Darüber hinaus bietet es auch ein benutzerfreundliches Framework zum Trainieren verschiedener maschineller Lernalgorithmen. Lernmodelle. Klassifikatoren wurden mithilfe der wiederholten (3 Wiederholungsiterationen) 10-fachen Kreuzvalidierung der Trainingskohorte (Lung1) trainiert und ihre Vorhersageleistung in der Validierungskohorte (Lung2) anhand der Fläche unter der ROC-Kurve (AUC) bewertet. Wir verwendeten Parameterkonfigurationen, die zuvor von Fernandez-Delgado et al.31 in einer umfassenden Vergleichsstudie mit 179 Klassifikatoren und 121 verschiedenen Datensätzen definiert wurden. Wir haben die Klassifizierungsmethoden zusammen mit ihren Parametern und entsprechenden R-Paketen in Supplementary-C online aufgelistet.

Um verschiedene Methoden zur Merkmalsauswahl und -klassifizierung zu untersuchen und zu vergleichen, haben wir für die Analyse ein dreidimensionales Parametergitter erstellt. Für jede der 14 Feature-Auswahlmethoden haben wir inkrementell Features im Bereich von 5 bis 50 ausgewählt, mit einem Inkrement von 5 Features (n = 5, 10, 15, 20, …, 50). Diese Teilmengen ausgewählter Merkmale wurden dann mithilfe jedes der 12 Klassifikatoren für maschinelles Lernen und der Fläche unter ROC-Kurven (AUC) bewertet.

Um die Stabilität von Merkmalsauswahlmethoden zu bewerten, verwendeten wir ein von Yu et al.32 vorgeschlagenes Stabilitätsmaß unter den Einstellungen für harte Datenstörungen33. Wir haben die Stabilität einer Methode als Ähnlichkeit zwischen den Ergebnissen quantifiziert, die mit derselben Merkmalsauswahlmethode erzielt wurden, wenn sie auf die beiden nicht überlappenden Partitionen (der Größe N/2) der Trainingskohorte (Lung1) angewendet wurden. Um die Ähnlichkeit zwischen den beiden resultierenden Merkmalssätzen zu berechnen, wurde ein gewichteter vollständiger zweiteiliger Graph erstellt, in dem die beiden Knotensätze den beiden Sätzen ausgewählter Merkmale entsprachen. Die Kantengewichte wurden als absoluter Spearman-Korrelationskoeffizient zwischen den Merkmalen an den Knoten zugewiesen. Anschließend haben wir den ungarischen Algorithmus34 angewendet, um die maximale gewichtete Übereinstimmung zwischen den beiden Knotensätzen zu ermitteln, und dann wurde die Ähnlichkeit (Stabilität) als endgültige Übereinstimmungskosten quantifiziert. Für jede Merkmalsauswahlmethode haben wir die Stabilität 100 Mal mithilfe eines Bootstrap-Ansatzes berechnet und die Medianwerte ± Standardwerte in den Ergebnissen angegeben.

Die empirische Stabilität eines Klassifikators wurde mithilfe der relativen Standardabweichung (RSD %) und eines Bootstrap-Ansatzes quantifiziert. Wir haben zunächst 30 repräsentative Merkmale mithilfe der Wilcoxon-basierten Merkmalsauswahlmethode WLCX ausgewählt und diese zur Berechnung der Klassifikatorstabilität verwendet. Für jede Klassifizierungsmethode haben wir das Modell auf der unterabgetasteten Trainingskohorte (Größe N/2) trainiert und die Leistung auf der Validierungskohorte mithilfe der AUC validiert. Die Teilstichprobe der Trainingskohorte wurde 100 Mal unter Verwendung eines Bootstrap-Ansatzes durchgeführt. RSD ist der absolute Wert des Variationskoeffizienten und wird oft in Prozent ausgedrückt. Hier wurde es definiert als

wobei und die Standardabweichung bzw. der Mittelwert der 100 AUC-Werte waren. Es ist zu beachten, dass eine höhere Stabilität bei Klassifikatoren mit niedrigeren RSD-Werten einhergeht.

Um die äußerst zuverlässigen und genauen Methoden zu ermitteln, verwendeten wir die Medianwerte von AUC und Stabilität als Schwellenwerte. Wir haben zwei Ranglisten basierend auf AUC und Stabilität erstellt und die Methoden als äußerst genau und zuverlässig bezeichnet, die in der oberen Hälfte beider Ranglisten rangierten. Merkmalsauswahlmethoden mit einer Stabilität ≥ 0,735 (mittlere Stabilität aller Merkmalsauswahlmethoden) und einer AUC ≥ 0,615 (mittlere AUC aller Merkmalsauswahlmethoden) gelten als äußerst zuverlässige und genaue Methoden. Ebenso gelten Klassifizierungsmethoden mit RSD ≤ 5,97 (mittlerer RSD aller Klassifikatoren) und AUC ≥ 0,61 (mittlerer AUC aller Klassifikatoren) als äußerst zuverlässig und genau.

Es gibt drei experimentelle Hauptfaktoren, die möglicherweise die Vorhersage der auf Radiomics basierenden Überlebensvorhersage beeinflussen können: Merkmalsauswahlmethode, Klassifizierungsmethode und die Anzahl der ausgewählten Merkmale. Die Multifaktor-ANOVA wurde verwendet, um die Variabilität der AUC-Werte zu quantifizieren, die durch diese Faktoren und ihre Wechselwirkungen verursacht werden. Um die von jedem Faktor verursachte Variabilität zu vergleichen, wurden die geschätzten Varianzkomponenten durch die Gesamtvarianz dividiert.

Die gesamte Analyse wurde mit R-Software (R Core Team, Wien, Österreich) Version 3.1.2 und Matlab R2012b (The Mathworks, Natick, MA) mit Windows 7 durchgeführt.

Um die maschinellen Lernansätze für prognostische radiomische Biomarker zu untersuchen, wurden insgesamt 440 radiomische Merkmale aus den segmentierten Tumorregionen der CT-Bilder vor der Behandlung von zwei unabhängigen NSCLC-Kohorten extrahiert. Das Merkmalsauswahl- und Klassifizierungstraining wurde mithilfe der Trainingskohorte Lung1 (n = 310 Patienten) durchgeführt, während die Validierungskohorte Lung2 (n = 154 Patienten) zur Bewertung der Vorhersageleistung verwendet wurde [siehe Abb. 1].

Aus den segmentierten Tumorregionen der CT-Bilder vor der Behandlung von 464 NSCLC-Patienten wurden insgesamt 440 radiomische Merkmale extrahiert.

Das Merkmalsauswahl- und Klassifizierungstraining wurde unter Verwendung der Trainingskohorte Lunge1 (n = 310) durchgeführt, während die Kohorte Lunge2 (n = 154) als Validierungskohorte verwendet wurde.

Die Vorhersageleistung verschiedener Methoden zur Merkmalsauswahl und -klassifizierung wurde anhand der Fläche unter der Receiver-Operator-Characteristic-Curve (AUC) bewertet. Abbildung 2 zeigt die Leistung der Merkmalsauswahl (in Zeilen) und der Klassifizierungsmethoden (in Spalten) anhand von 30 ausgewählten Merkmalen, bei denen es sich um die 30 am höchsten bewerteten Merkmale handelt, die zur Merkmalsauswahl führten. Für jede Klassifizierungsmethode gibt es 14 AUC-Werte, die den 14 verschiedenen Merkmalsauswahlmethoden entsprechen. Wir haben einen Median aller 14 AUC-Werte als repräsentative AUC eines Klassifikators verwendet. Ebenso wird für jede Merkmalsauswahlmethode ein Median von 12 AUCs (entsprechend 12 Klassifizierungsmethoden) als repräsentative AUC verwendet. Diese repräsentativen AUC-Werte für die Klassifizierungs- und Merkmalsauswahlmethoden sind in Tabelle 2 angegeben. Bei den Klassifizierungsmethoden zeigte Random Forest (RF) die höchste Vorhersageleistung (AUC: 0,66 ± 0,03) (Median ± Standard), während Entscheidungsbaum (DT) ( AUC: 0,54 ± 0,04) zeigte die niedrigste Vorhersageleistung. Was die Merkmalsauswahlmethoden betrifft, zeigte die auf dem Wilcoxon-Test basierende Methode WLCX die höchste Vorhersageleistung (AUC: 0,65 ± 0,02), während die Methoden CHSQ (AUC: 0,60 ± 0,03) und CIFE (AUC: 0,60 ± 0,04) den niedrigsten Median aufwiesen AUCs. Wir haben das obige Experiment wiederholt, indem wir die Anzahl der ausgewählten Features variiert haben (Bereich 5–50). Ergebnisse, die 10, 20, 40 und 50 repräsentativen (höchst bewerteten) Merkmalen entsprechen, werden in den ergänzenden Abbildungen S1, S2, S3 und S4 online angegeben. Darüber hinaus werden die mittleren AUC-Werte für jeden der experimentellen Faktoren (Merkmalsauswahlmethoden, Klassifizierungsmethoden und Anzahl ausgewählter Merkmale) durch die Heatmaps in den ergänzenden Abbildungen S5, S6 und S7 online dargestellt. Auch hier zeigten Random Forest (RF) (Klassifikator) und die auf dem Wilcoxon-Test basierende Methode WLCX (Merkmalsauswahl) in den meisten Fällen die höchsten mittleren AUCs.

Heatmap, die die Vorhersageleistung (AUC) der Methoden zur Merkmalsauswahl (in Zeilen) und Klassifizierung (in Spalten) darstellt.

Es ist zu beobachten, dass die Klassifizierungsmethoden RF, BAG und BY sowie die Merkmalsauswahlmethoden WLCX, MRMR und MIFS in vielen Fällen eine relativ hohe Vorhersageleistung aufweisen.

Wir haben die Methoden zur Merkmalsauswahl im Hinblick auf ihre Stabilität gegenüber Daten-Resampling unter Verwendung der Einstellungen für harte Datenstörungen bewertet33. Wir beobachteten, dass MIM die stabilste Methode war (Stabilität = 0,94 ± 0,02) (Median ± Standard), gefolgt von RELIEF (Stabilität = 0,91 ± 0,05) und WLCX (Stabilität = 0,84 ± 0,05), während GINI (Stabilität = 0,68 ± 0,10) , JMI (Stabilität = 0,68 ± 0,05), CHSQ (Stabilität = 0,69 ± 0,09), DISR (Stabilität = 0,69 ± 0,05) und CIFE (Stabilität = 0,69 ± 0,05) zeigten eine relativ geringe Stabilität [Tabelle 2].

Die empirische Stabilität der Klassifizierungsmethoden wurde mithilfe der relativen Standardabweichung (RSD) und eines Bootstrap-Ansatzes quantifiziert. Wir stellten fest, dass BY die stabilste Klassifizierungsmethode war (RSD = 0,86 %), gefolgt von GLM (RSD = 2,19 %), PLSR (RSD = 2,24 %) und RF (RSD = 3,52 %). BST hatte die höchste relative Standardabweichung der AUC-Scores (RSD = 8,23 %) und daher die niedrigste Stabilität unter den Klassifizierungsmethoden. RSD-Werte (%) für alle 12 Klassifikatoren sind in Tabelle 2 aufgeführt.

Die Streudiagramme in Abb. 3 bewerten die Stabilität und Vorhersageleistung. Es kann beobachtet werden, dass die Merkmalsauswahlmethoden WLCX (Stabilität = 0,84 ± 0,05, AUC = 0,65 ± 0,02), MIFS (Stabilität = 0,8 ± 0,03, AUC = 0,63 ± 0,03), MRMR (Stabilität = 0,74 ± 0,03, AUC = 0,63 ±) verwendet werden 0,03) und FSCR (Stabilität = 0,78 ± 0,08, AUC = 0,62 ± 0,04) sollten bevorzugt werden, da ihre Stabilität und Vorhersageleistung höher war als die entsprechenden Medianwerte aller Merkmalsauswahlmethoden (Stabilität = 0,735, AUC = 0,615). Ähnliches gilt für Klassifizierungsmethoden: RF (RSD = 3,52 %, AUC = 0,66 ± 0,03), BY (RSD = 0,86 %, AUC = 0,64 ± 0,05), BAG (RSD = 5,56 %, AUC = 0,64 ± 0,03), GLM (RSD). = 2,19 %, AUC = 0,63 ± 0,02) und PLSR (RSD = 2,24 %, AUC = 0,63 ± 0,02) waren die Stabilität und die Vorhersageleistung höher als die entsprechenden Medianwerte (RSD = 5,93 %, AUC = 0,61).

Streudiagramme zwischen der Stabilität und Vorhersageleistung (AUC) der Merkmalsauswahl (FS) (links) und Klassifizierungsmethoden (CF) (rechts).

Merkmalsauswahlmethoden mit einer Stabilität ≥ 0,735 (mittlere Stabilität des FS) und einer AUC ≥ 0,615 (mittlere AUC des FS) gelten als äußerst zuverlässige und prädiktive Methoden. Ebenso gelten Klassifizierungsmethoden mit RSD ≤ 5,97 (mittlerer RSD von CF) und AUC ≥ 0,61 (mittlerer AUC von CF) als äußerst zuverlässig und genau. Hochzuverlässige und prädiktive Methoden werden in einem grauen quadratischen Bereich angezeigt.

Um die Auswirkungen der drei experimentellen Faktoren (Merkmalsauswahlmethoden, Klassifizierungsmethoden und Anzahl der ausgewählten Merkmale) zu quantifizieren, führten wir eine Multifaktor-Varianzanalyse (ANOVA) der AUC-Scores durch. Wir haben beobachtet, dass alle drei experimentellen Parameter und ihre Wechselwirkungen die wesentlichen Faktoren sind, die die Vorhersageleistung beeinflussen [Abb. 4]. Die Klassifizierungsmethode war die wichtigste Variabilitätsquelle, da sie 34,21 % der Gesamtvarianz der AUC-Werte erklärte. Die Merkmalsauswahl machte 6,25 % aus, während das Zusammenspiel von Klassifikator und Merkmalsauswahl 23,03 % der Gesamtvariation erklärte. Die Größe der ausgewählten (repräsentativen) Merkmalsteilmenge machte nur 1,65 % der Gesamtvarianz aus [Abb. 4].

Variation der AUC erklärt durch die experimentellen Faktoren und ihre Wechselwirkungen.

Es lässt sich beobachten, dass die Klassifizierungsmethode die wichtigste Variabilitätsquelle war. Die Größe der ausgewählten (repräsentativen) Merkmalsteilmenge hatte den geringsten Anteil an der Gesamtvarianz.

Die medizinische Bildgebung ist eine routinemäßig genutzte und leicht zugängliche Informationsquelle in der klinischen Onkologie. Es dient als nicht-invasives und kostengünstiges Instrument zur Krebsdiagnose. Radiomics nutzt die medizinischen Bilddaten für die individuelle Gestaltung der Krebsbehandlung und fügt so der Präzisionsonkologie eine neue und vielversprechende Dimension hinzu2,3,8. Darüber hinaus kann es auch die Heterogenität innerhalb des Tumors erfassen, die oft als wichtiger Biomarker in der Onkologie angesehen wird12,35,36,37. In einer Reihe von Studien wurden Radiomics-basierte Vorhersagemodelle für verschiedene klinische Faktoren (Tumorgrade, Überlebensergebnisse, Ansprechen auf die Behandlung usw.) erstellt12. Für die erfolgreiche Umsetzung radiomikbasierter prädiktiver Analysen ist es erforderlich, verschiedene Methoden zur Merkmalsauswahl und prädiktiven Modellierung zu bewerten und zu vergleichen, was das Hauptziel dieser Studie war.

Für Data-Mining-Probleme mit hohem Durchsatz wurden verschiedene Methoden zur Merkmalsauswahl eingesetzt38. Im Allgemeinen werden Funktionsauswahlmethoden in drei Hauptkategorien eingeteilt: (1) Filtermethoden, (2) Wrapper-Methoden und (3) eingebettete Methoden. In dieser Studie untersuchten wir 14 verschiedene filterbasierte Ansätze für die Radiomics-basierte Überlebensvorhersage. Wir haben nur filterbasierte Ansätze verwendet, da diese rechnerisch effizienter und weniger anfällig für Überanpassungen sind als die Wrapper- und eingebetteten Methoden18,27. Darüber hinaus sind Filtermethoden im Gegensatz zu Wrapper- und eingebetteten Methoden vom Klassifikator unabhängig. Somit ermöglichen sie eine Trennung der Modellierungs- und Merkmalsauswahlkomponente der prädiktiven Analyse, was die Generalisierbarkeit jeder Komponente und damit der Gesamtanalyse erhöht.

Wir haben außerdem 12 Klassifizierungsmethoden für maschinelles Lernen untersucht, die zu 12 verschiedenen Klassifikatorfamilien gehören. In der Literatur zum maschinellen Lernen wurden viele Klassifikatoren vorgeschlagen. Theoretisch gehören diese Klassifikatoren verschiedenen Bereichen (Klassifikatorfamilien) der Informatik und Statistik an. Daher könnte es wirklich schwierig sein, die zugrunde liegenden Annahmen jedes einzelnen Klassifikators zu verstehen und die Parameter unvoreingenommen abzustimmen. Die Parameterabstimmung könnte dadurch verzerrt sein, dass der Benutzer über mehr (oder mangelndes) Fachwissen mit einigen Klassifikatoren verfügt als mit anderen. Normalerweise vergleichen die Studien, die einen neuen Klassifikator vorschlagen, diesen nur mit den Referenzklassifikatoren derselben Familie und schließen die anderen Klassifikatorfamilien aus. Selbst wenn zum Vergleich Klassifikatoren in Betracht gezogen werden, die zu verschiedenen Familien gehören, werden diese Referenzklassifikatoren normalerweise mit einfachen Werkzeugen und mit begrenzten Parameterkonfigurationen implementiert, während der vorgeschlagene Klassifikator sorgfältig abgestimmt wird. Diese könnten folglich die Ergebnisse zugunsten der vorgeschlagenen Klassifikatoren verzerren31. In unserer Studie schlagen wir keinen neuen Klassifikator vor und haben für alle Klassifikatoren dasselbe Implementierungstool (R-Paket-Caret) verwendet. Um eine unvoreingenommene Verwendung von Klassifikatoren sicherzustellen, verwendeten wir außerdem Parameterkonfigurationen, die zuvor von Fernandez-Delgado et al.31 in einer umfassenden Studie zum Vergleich von 179 Klassifikatoren in 121 verschiedenen Datensätzen definiert wurden. Diese Parameterkonfigurationen wurden aus der Literatur ausgewählt und zuvor anhand einer großen Anzahl (121) Datensätze aus verschiedenen Bereichen validiert. Darüber hinaus wurden in unserer Studie die Parameter nur mithilfe der wiederholten Kreuzvalidierung von Trainingsdaten optimiert. Unser experimentelles Design ermöglichte es uns daher, verschiedene Klassifizierungsmethoden unvoreingenommen zu bewerten.

Unsere Ergebnisse zeigen, dass die auf dem Wilcoxon-Test basierende Merkmalsauswahlmethode WLCX bei den meisten Klassifikatoren die höchste Vorhersageleistung liefert. Interessanterweise ist WLCX eine einfache univariate Methode basierend auf Rängen, die die Redundanz ausgewählter Features beim Feature-Ranking nicht berücksichtigt. Die meisten Merkmalsauswahlmethoden lieferten die höchste Vorhersageleistung, wenn sie mit dem Random Forest (RF)-Klassifikator verwendet wurden. Man könnte argumentieren, dass sich die Leistung von Klassifizierungsmethoden mit unterschiedlichen Parameterkonfigurationen weiter verbessern könnte. Eine umfassende Parameterabstimmung könnte untersucht werden, um die Verbesserung der Vorhersageleistung zu bewerten. Allerdings können die erforderlichen Rechenressourcen und die hohe zeitliche Komplexität eine umfassende Suche behindern. Wir gehen davon aus, dass zukünftige Radiomic-Studien, die sich auf unterschiedliche klinische Ergebnisse und ähnliche Analyserahmen konzentrieren, diesbezüglich zu einem besseren Verständnis führen könnten. Eine begrenzte Anzahl von Methoden, die in verschiedenen radiomischen Studien eine konstant hohe Leistung erbringen, könnten durch eine umfassende Parameterabstimmung weiter bewertet werden. Dennoch ist zu beachten, dass Random Forests (RF) auch in mehreren anderen biomedizinischen und anderen Domänenanwendungen eine hohe Vorhersageleistung gezeigt haben31. Diese Ergebnisse deuten darauf hin, dass die Wahl der WLCX-Funktionsauswahlmethode und/oder der RF-Klassifizierungsmethode die Vorhersageleistung in der Radiomics steigert.

Ergebnisse im Zusammenhang mit unserer Stabilitätsanalyse bieten eine weitere Dimension für die Auswahl der Merkmalsauswahl- und Klassifizierungsmethoden. Abhängig von den Anwendungen kann man der Vorhersageleistung oder -stabilität Bedeutung beimessen und sich entsprechend für die erforderliche Methode entscheiden. Ergebnisse im Zusammenhang mit der Multifaktor-ANOVA zeigten, dass die Klassifizierungsmethode die wichtigste Variationsquelle in der Vorhersageleistung (AUC) ist und daher sorgfältig ausgewählt werden sollte. Die Größe der ausgewählten Merkmalsteilmenge trug am wenigsten zur Gesamtvariation der AUC bei.

Nur wenige Studien haben verschiedene Methoden zur Merkmalsauswahl und maschinellen Lernmodellierung für auf Radiomics basierende klinische Vorhersagen untersucht und verglichen19,20. Kürzlich haben Hawkins et al.19 vier verschiedene Methoden zur Merkmalsauswahl und -klassifizierung für die CT-basierte Überlebensvorhersage von NSCLC-Patienten verglichen. Diese Studie war jedoch durch die geringe Kohortengröße begrenzt, da die endgültigen Ergebnisse nur an 40 Patienten erzielt wurden. Darüber hinaus fehlte auch eine unabhängige Validierung der Ergebnisse. Im Gegenteil, in unserer Analyse wurden zwei unabhängige radiomische Kohorten der Größen 310 und 154 Patienten verwendet, und es wurde über eine unabhängige Validierung der Ergebnisse berichtet.

Unsere Radiomic-Analyse konzentriert sich auf die Vorhersage des zweijährigen Patientenüberlebens bei NSCLC-Patienten. Es bietet eine unvoreingenommene Bewertung verschiedener maschineller Lernmethoden zur Merkmalsauswahl und -klassifizierung. Es könnte als Referenz für zukünftige, auf Radiomics basierende Vorhersagestudien betrachtet werden. Unsere Ergebnisse zeigten, dass die Wahl der auf dem Wilcoxon-Test basierenden Merkmalsauswahlmethode WLCX und/oder der Random Forest (RF)-Klassifizierungsmethode die beste Leistung für die auf Radiomics basierende Überlebensvorhersage bietet. Darüber hinaus erwiesen sich diese Methoden auch als einigermaßen stabil gegenüber Datenstörungen und könnten daher für auf Radiomics basierende Vorhersagestudien bevorzugt werden. Diese Ergebnisse sollten in anderen Radiomics-basierten Vorhersagestudien mit unterschiedlichen Bildgebungsmodalitäten und bei unterschiedlichen Krebsarten weiter getestet werden.

Es wurde bereits gezeigt, dass statistische Modelle, die auf den Tumor- und Behandlungsmerkmalen des Patienten basieren, bei NSCLC-Patienten deutlich bessere Vorhersagen liefern als der menschliche Experte24. Darüber hinaus haben mehrere andere Studien die eingeschränkte Prognosefähigkeit von Ärzten für unheilbar erkrankte Krebspatienten hervorgehoben39,40,41. Die Vorhersagen menschlicher Experten können unter der Variabilität zwischen Beobachtern leiden. Im Gegenteil könnten statistische Modelle das Vorhersagesystem deterministischer machen, wenn die Parameterkonfigurationen und der Trainingsrahmen festgelegt sind.

Der potenzielle klinische Nutzen von auf Radiomics basierenden Prognosemodellen wurde in einer früheren Studie dargelegt8. Mit zunehmenden Radiomics-Kohorten und Merkmalsdimensionen erwarten wir eine höhere Vorhersageleistung in zukünftigen Radiomic-Studien. Darüber hinaus könnten integrative Studien wie Radiomics-Genomics in Kombination mit standardmäßigen klinischen Kovariaten auch die Vorhersageleistung verbessern und den Nutzen dieser Methoden in der klinischen Praxis weiter validieren. Insgesamt ist unsere Analyse ein Schritt vorwärts in Richtung der Verbesserung radiomikbasierter klinischer Vorhersagen.

Zitierweise für diesen Artikel: Parmar, C. et al. Methoden des maschinellen Lernens für quantitative radiomische Biomarker. Wissenschaft. Rep. 5, 13087; doi: 10.1038/srep13087 (2015).

Doroshow, J. & Kummar, S. Translationale Forschung in der Onkologie – 10 Jahre Fortschritt und Zukunftsaussichten. Nat. Rev. Clin. Oncol. 11, 649 (2014).

Artikel CAS Google Scholar

Lambin, P. et al. Vorhersage von Ergebnissen in der Radioonkologie – multifaktorielle Entscheidungsunterstützungssysteme. Nat. Rev. Clin. Oncol. 10, 27–40 (2013).

Artikel Google Scholar

Lambin, P. et al. Radiomics: Extrahieren weiterer Informationen aus medizinischen Bildern mithilfe erweiterter Merkmalsanalyse. EUR. J. of Cancer 48, 441–446 (2012).

Artikel Google Scholar

Coroller, TP et al. CT-basierte Radiomic-Signatur sagt Fernmetastasen bei Lungenadenokarzinomen voraus. Radiothe. Oncol. (2015), http://dx.doi.org/10.1016/j.radonc.2015.02.015 (2015).

Cook, GJ et al. Sind Strukturmerkmale von 18F-FDG-PET-Tumoren vor der Behandlung bei nicht-kleinzelligem Lungenkrebs mit dem Ansprechen und dem Überleben nach einer Radiochemotherapie verbunden? J. Nucl. Med. 54, 19–26 (2013).

Artikel Google Scholar

Ganeshan, B. et al. Nichtkleinzelliger Lungenkrebs: histopathologische Korrelate für Texturparameter im CT. Radiologie 266, 326–336 (2013).

Artikel Google Scholar

Gevaert, O. et al. Glioblastoma multiforme: explorative radiogenomische Analyse unter Verwendung quantitativer Bildmerkmale. Radiologie 273, 168–174 (2014).

Artikel Google Scholar

Aerts, HJ et al. Entschlüsselung des Tumorphänotyps durch nichtinvasive Bildgebung unter Verwendung eines quantitativen Radiomics-Ansatzes. Nat. Komm. 5 (2014).

Leijenaar, RT et al. Stabilität der FDG-PET Radiomics-Funktionen: Eine integrierte Analyse der Test-Retest- und Inter-Beobachter-Variabilität. Acta Oncol. 52, 1391–1397 (2013).

Artikel CAS Google Scholar

Parmar, C. et al. Robuste Radiomics bieten Quantifizierung mittels halbautomatischer volumetrischer Segmentierung. PLOS ONE 9, e102107 (2014).

Artikel ADS Google Scholar

Ganeshan, B., Abaleke, S., Young, RC, Chatwin, CR & Miles, KA Texturanalyse von nichtkleinzelligem Lungenkrebs mittels nicht-verstärkter Computertomographie: erste Hinweise auf einen Zusammenhang mit dem Glukosestoffwechsel und dem Stadium des Tumors. Cancer Imaging 10, 137 (2010).

Artikel Google Scholar

Alic, L., Niessen, WJ & Veenland, JF Quantifizierung der Heterogenität als Biomarker in der Tumorbildgebung: eine systematische Übersicht. PLOS ONE 9, e110300 (2014).

Artikel ADS Google Scholar

Jain, R. et al. Ergebnisvorhersage bei Patienten mit Glioblastom mithilfe von Bildgebung, klinischen und genomischen Biomarkern: Fokus auf die nicht verstärkende Komponente des Tumors. Radiologie 272, 484–493 (2014).

Artikel Google Scholar

Nicolasjilwan, M. et al. Die Hinzufügung von MR-Bildgebungsfunktionen und genetischen Biomarkern stärkt die Überlebensvorhersage für Glioblastome bei TCGA-Patienten. J. Neuroradiol. (2014), 10.1016/j.neurad.2014.02.006. (2014).

Segal, E. et al. Entschlüsselung globaler Genexpressionsprogramme bei Leberkrebs durch nichtinvasive Bildgebung. Nat. Biotechnologie. 25, 675–680 (2007).

Artikel CAS Google Scholar

Mohri, M., Rostamizadeh, A. & Talwalkar, A. Grundlagen des maschinellen Lernens. CH. 1, 1–3, (MIT Press, 2012).

Google Scholar

Pękalska, E. & Duin, RP Die Unähnlichkeitsdarstellung zur Mustererkennung: Grundlagen und Anwendungen. Bd. 64 (World Scientific, 2005).

Guyon, I. & Elisseeff, A. Eine Einführung in die Variablen- und Merkmalsauswahl. J. Mach. Lernen. Res. 3, 1157–1182 (2003).

MATH Google Scholar

Hawkins, SH et al. Vorhersage der Ergebnisse von nichtkleinzelligem Lungenkrebs mithilfe von CT-Bildfunktionen. IEEE Access 2, 1418–1426 (2014).

Artikel Google Scholar

Basu, S. et al. in Systems, Man and Cybernetics (SMC), 2011 IEEE International Conference on. 1306–1312 (IEEE).

Haralick, RM, Shanmugam, K. & Dinstein, IH Texturmerkmale für die Bildklassifizierung. IEEE Trans. Syst., Man Cybern. 6, 610–621 (1973).

Artikel Google Scholar

Galloway, MM Texturanalyse unter Verwendung von Graustufen-Lauflängen. Berechnen. Visionsdiagramm. 4, 172–179 (1975).

Google Scholar

Deasy, JO, Blanco, AI & Clark, VH CERR: eine Computerumgebung für die Strahlentherapieforschung. Med. Physik. 30, 979–985 (2003).

Artikel Google Scholar

Oberije, C. et al. Eine prospektive Studie, die die Vorhersagen von Ärzten mit Modellen für den Behandlungserfolg von Lungenkrebspatienten vergleicht: ein Schritt in Richtung individueller Versorgung und gemeinsamer Entscheidungsfindung. Radiothe. Oncol. 112, 37–43 (2014).

Artikel Google Scholar

Hoang, T., Daten der Onkologiegruppe. J. Clin. Oncol. 23, 175–183 (2005).

Artikel CAS Google Scholar

Cistaro, A. et al. Vorhersage des 2-Jahres-Überlebens bei Patienten mit nichtkleinzelligem Lungenkrebs im Stadium I und II unter Verwendung von 18F-FDG PET/CT SUV quantifica. Radiol. oncol. 47, 219–223 (2013).

Artikel Google Scholar

Brown, G., Pocock, A., Zhao, M.-J. & Luján, M. Bedingte Wahrscheinlichkeitsmaximierung: ein vereinheitlichender Rahmen für die informationstheoretische Merkmalsauswahl. J. Mach. Lernen. Res. 13, 27–66 (2012).

MathSciNet MATH Google Scholar

Zhao, Z. et al. Weiterentwicklung der Feature-Selection-Forschung. ASU-Feature-Auswahl-Repository (2010).

Kotsiantis, Sotiris B., Ioannis, D. Zaharakis & Panayiotis, E. Pintelas. Maschinelles Lernen: ein Überblick über Klassifizierungs- und Kombinationstechniken. Artif. Intel. Rev. 26.3, 159–190 (2006).

Artikel Google Scholar

Kuhn, M. Erstellen von Vorhersagemodellen in R mithilfe des Caret-Pakets. J. Stat. Softw. 28, 1–26 (2008).

Artikel Google Scholar

Fernández-Delgado, M., Cernadas, E., Barro, S. & Amorim, D. Brauchen wir Hunderte von Klassifikatoren, um reale Klassifizierungsprobleme zu lösen? J. Mach. Lernen. Res. 15, 3133–3181 (2014).

MathSciNet MATH Google Scholar

Yu, L., Ding, C. & Loscalzo, S. in Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 803-811 (ACM).

Haury, A.-C., Gestraud, P. & Vert, J.-P. Der Einfluss von Merkmalsauswahlmethoden auf Genauigkeit, Stabilität und Interpretierbarkeit molekularer Signaturen. PLOS ONE 6, e28210 (2011).

Artikel CAS ADS Google Scholar

Kuhn, HW Die ungarische Methode für das Zuordnungsproblem. Naval Res. Logis. Q. 2, 83–97 (1955).

Artikel MathSciNet Google Scholar

Fisher, R., Pusztai, L. & Swanton, C. Krebsheterogenität: Auswirkungen auf gezielte Therapeutika. Br. J Cancer 108, 479–485 (2013).

Artikel CAS Google Scholar

Ng, C., Pemberton, H. & Reis-Filho, J. Intratumorale genetische Heterogenität bei Brustkrebs: Ursachen und Auswirkungen. Experte Rev. Anticancer Ther. 12, 1021–1032 (2012).

Artikel CAS Google Scholar

Brown, JR, DiGiovanna, MP, Killelea, B., Lannin, DR & Rimm, DL Quantitative Bewertung des Ki-67-Scores zur Vorhersage des Ansprechens auf eine neoadjuvante Chemotherapie bei Brustkrebs. Labor. Investieren. 94, 98–106 (2014).

Artikel CAS Google Scholar

Bolón-Canedo, V., Sánchez-Maroño, N., Alonso-Betanzos, A., Benítez, J. & Herrera, F. Eine Übersicht über Microarray-Datensätze und angewandte Merkmalsauswahlmethoden. Informieren Sciences 282, 111–135 (2014).

Artikel Google Scholar

Christakis, NA, Smith, JL, Parkes, CM & Lamont, EB Ausmaß und Determinanten von Fehlern bei ärztlichen Prognosen bei unheilbar kranken Patienten: prospektive KohortenstudieKommentar: Warum überschätzen Ärzte? Kommentar: Prognosen sollten auf bewährten Indizes basieren, nicht auf Intuition. Bmj 320, 469–473 (2000).

Artikel CAS Google Scholar

Glare, P. et al. Eine systematische Überprüfung der Überlebensvorhersagen von Ärzten bei unheilbar kranken Krebspatienten. Bmj 327, 195 (2003).

Artikel Google Scholar

Clément-Duchêne, C., Carnin, C., Guillemin, F. & Martinet, Y. Wie genau sind Ärzte bei der Vorhersage des Patientenüberlebens bei fortgeschrittenem Lungenkrebs? Onkologe 15, 782–789 (2010).

Artikel Google Scholar

Referenzen herunterladen

Die Autoren danken dem National Institute of Health (NIH-USA U24CA194354 und NIH-USA U01CA190234), dem 7. Rahmenprogramm der EU (EURECA, ARTFORCE), dem Kankeronderzoekfonds Limburg von der Health Foundation Limburg und der Dutch Cancer Society (KWF UM 2009–4454) für finanzielle Unterstützung , KWF MAC 2013–6425).

Parmar Chintan und Grossmann Patrick haben gleichermaßen zu dieser Arbeit beigetragen.

Abteilungen für Radioonkologie,

Chintan Parmar, Patrick Grossmann & Hugo JWL Aerts

Radiologie, Dana-Farber Cancer Institute, Brigham and Women's Hospital, Harvard Medical School, Boston, MA, USA

Hugo JWL Aerts

Radioonkologie (MAASTRO), Forschungsinstitut GROW, Universität Maastricht, Maastricht, Niederlande

Chintan Parmar und Philippe Lambin

Machine Intelligence Unit, Indian Statistical Institute, Kalkutta, Indien

Chintan Parmar

Abteilung für Biostatistik und Computerbiologie, Dana-Farber Cancer Institute, Boston, MA, USA

Patrick Grossmann & Hugo JWL Aerts

Abteilung für Radioonkologie, Radboud University Medical Center, Nijmegen, Niederlande

Johan Bussink

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

HJWLA, CP und PG konzipierten das Projekt, analysierten die Daten und verfassten die Arbeit. JB und PL stellten fachkundige Beratung, Daten oder Analysetools zur Verfügung und überprüften das Manuskript.

Die Autoren geben an, dass keine konkurrierenden finanziellen Interessen bestehen.

Dieses Werk ist unter einer Creative Commons Attribution 4.0 International License lizenziert. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe nichts anderes angegeben ist; Wenn das Material nicht unter der Creative-Commons-Lizenz enthalten ist, müssen Benutzer die Erlaubnis des Lizenzinhabers einholen, um das Material zu reproduzieren. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/

Nachdrucke und Genehmigungen

Parmar, C., Grossmann, P., Bussink, J. et al. Methoden des maschinellen Lernens für quantitative radiomische Biomarker. Sci Rep 5, 13087 (2015). https://doi.org/10.1038/srep13087

Zitat herunterladen

Eingegangen: 2. April 2015

Angenommen: 17. Juli 2015

Veröffentlicht: 17. August 2015

DOI: https://doi.org/10.1038/srep13087

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Militärmedizinische Forschung (2023)

BMC Gastroenterologie (2023)

Europäische Radiologie (2023)

Zeitschrift für Krebsforschung und klinische Onkologie (2023)

Japanisches Journal für Radiologie (2023)

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.