Auto Ml
Auto Ml – Das größere Python-Ökosystem umfasst Tools, die viele verschiedene Aufgaben in der Pipeline für Datenanalyse und maschinelles Lernen (ML) beschleunigen. Wenn es darum geht, datengesteuerte Modelle bereitzustellen, verwenden Datenanalyseteams häufig das bekannte CRISP-DM-Modell als Rahmen.
Glücklicherweise gibt es eine Reihe von Tools, die unter dem Begriff „AutoML“ zusammengefasst werden und Data-Science-Teams in bestimmten Schritten des CRISP-DM-Prozesses beschleunigen und unterstützen können.
Auto Ml
In diesem Beitrag werde ich einige nützliche Python-Tools (in keiner bestimmten Reihenfolge) zur Automatisierung Ihrer ML-Arbeit überprüfen.
Introducing Nova Automl: A New Architecture For Predictive Insights
Um die AutoML-Pakete in diesem Beitrag auszuprobieren, installieren Sie am einfachsten unsere AutoML-Tool-Laufzeitumgebung für Windows oder Linux, die eine Version von Python und viele der hier vorgestellten Pakete enthält.
Um die gebrauchsfertige AutoML-Tool-Python-Umgebung herunterzuladen, müssen Sie ein Plattformkonto erstellen. Verwenden Sie einfach Ihre GitHub-Anmeldeinformationen oder Ihre E-Mail-Adresse, um sich zu registrieren. Die Anmeldung ist einfach und schaltet viele Vorteile der Plattform für Sie frei!
Führen Sie für Windows-Benutzer Folgendes von einer CMD-Eingabeaufforderung aus, um unser CLI-State-Tool automatisch herunterzuladen und zusammen mit der AutoML-Tool-Laufzeit in einer virtuellen Umgebung zu installieren:
Führen Sie für Linux-Benutzer Folgendes aus, um unser CLI-State-Tool automatisch herunterzuladen und zusammen mit der AutoML-Tool-Laufzeit in einer virtuellen Umgebung zu installieren:
What Is Automated Machine Learning?
Panda Profiling ermöglicht Ihnen eine schnelle EDA mit nur wenigen Codezeilen und ist eine nützliche Möglichkeit, den AutoML-Prozess zu starten. Die Ergebnisse sind leicht zu lesen und zu teilen, aber sie ersetzen nicht die detaillierte Analyse, die ein erfahrener Datenwissenschaftler aus demselben Datensatz erstellen kann. EDA nimmt Rohdaten und identifiziert Datensätze sowie Variablen, Typen, Bereiche und fehlende Werte. Panda Profiling erstellt einen Bericht (aus einem Panda-Datenrahmen), der verschiedene beschreibende Statistiken für jede Variable enthält, wie unten gezeigt:
Snorkel ist nützlich für Klassifizierungsaufgaben, die mit unvollständigen Daten beginnen oder denen Zielbezeichnungen fehlen. Daher bietet Snorkel eine Reihe von Tools an:
Es ist in allen verschiedenen Situationen nützlich. Beispielsweise haben Sie möglicherweise ein Problem mit einem bestimmten Datensatz, weil Sie einen Satz von Variablen, aber kein Ziel haben. Dinge manuell zu beschriften wäre zeitaufwändig, aber Snorkel kann dies automatisch mithilfe von Beschriftungsfunktionen (LFs) tun, bei denen es sich um prädiktive und programmgesteuerte regelbasierte Funktionen handelt, die Datensätzen Beschriftungen zuweisen. Dieser Prozess ist als schwacher Beobachtungsansatz bekannt:
Im vorherigen Beispiel haben wir zwei „Spielzeug“-LFs definiert, die auf das Spam-Dataset angewendet wurden. Der Datenrahmen L_train enthält den aus den LFs pro Zeile berechneten Zielwert. Ein wichtiger Anwendungsfall für das Schnorcheln ist die Designated-Label-Analyse, die Abdeckungsmaße, Wahr/Falsch und empirische Genauigkeit umfasst.
Python Automl Frameworks Data Scientists Can Use
Angenommen, Sie haben einen sauberen Datensatz, der für überwachtes Lernen bereit ist. In diesem Fall können Sie eine Single-Box-Lösung verwenden:
Im obigen Beispiel habe ich einige einfache Einstellungen für den Anpassungsprozess ausgewählt. Mit der Standardkonfiguration generiert der obige Code einen „Speicherordner“, der die Vorhersage und Wichtigkeit von Ressourcen enthält. Der Nachteil von MLBox ist, dass es nur bei Inspektionsaufgaben funktioniert und das Feature-Engineering sehr einfach ist.
Während der CRISP-DM-Prozess bei der Automatisierung des ML-Prozesses hilft, gibt es eine andere Lösung, die Ihnen die Möglichkeit bietet, alles zu automatisieren, was mit dem Erstellen und Bereitstellen von Modellen aus praktisch allen Daten zusammenhängt. H2O.ai ist eine vollständige Suite von Tools, die den gesamten Datenanalysezyklus verwalten, einschließlich:
Das AutoML-Modul ermöglicht es Ihnen, „automatisch“ eine Rangliste von Algorithmen zu erhalten und umfasst die Visualisierung und Interpretation der Ergebnisse.
Tutorial: Train A Model By Using Automated Machine Learning
H2O bietet Python- und R-Clients an. Ausführliche Dokumentation und Tutorials (auch auf Spanisch verfügbar) führen Sie durch den gesamten Prozess. Das AutoML-Modul verwendet auch eine webbasierte grafische Benutzeroberfläche (GUI), sodass Sie durch Zeigen und Klicken Parameter auswählen können. Und es lässt sich immer noch sehr gut in Bereitstellungen auf Unternehmensebene skalieren (einschließlich natürlich Hadoop, Spark und Kubernetes). Und das Beste ist, es ist Open Source, also gibt es keine Entschuldigung, es nicht auszuprobieren.
Eine andere Möglichkeit, ML zu automatisieren, ist die Verwendung eines Data-Science-Assistenten wie TPOT, was für Tree-Based Pipeline Optimization Tool steht. Nach dem Löschen Ihrer Daten kann TPOT helfen:
Nach der Einrichtung erkennt TPOT eine große Anzahl von Kombinationen und zeigt während der Ausführung Teilergebnisse an. Aber wenn Ihr Problem nicht trivial ist (wie in unserem Beispiel), erwarten Sie keine sofortigen Ergebnisse.
Ein nettes Feature von TPOT ist, dass es sich in Dask integriert, um Trainingsaufgaben zu parallelisieren. Dies wird definitiv dazu beitragen, die Ergebnisse zu beschleunigen und die Nutzung der Ressourcen Ihrer Maschine zu optimieren. Darüber hinaus experimentiert das Team hinter TPOT mit neuronalen Netzwerken und Deep-Learning-Unterstützung durch PyTorch. Der Hauptnachteil von TPOT ist, dass es nicht in der Lage ist, klassifizierte Daten automatisch zu verarbeiten. Stattdessen müssen Sie es zuerst codieren.
Novel Application Of An Automated Machine Learning Development Tool For Predicting Burn Sepsis: Proof Of Concept
Wenn Sie Erfahrung mit Deep Learning haben, haben Sie wahrscheinlich schon von Keras gehört, das eine Abstraktionsschicht auf TensorFlow bietet. Autokeras enthält Bausteine zum Klassifizieren und Regressieren von Text, Bildern und strukturierten Daten. Sobald Sie eine High-Level-Architektur für Ihr Modell ausgewählt haben, passt Autokeras das Modell für Sie an. Es wurde so einfach wie die scikit-learn-API entwickelt.
Der Nachteil ist, dass es keine Visualisierungen für die Modellanzeige oder andere Tools wie die Interpretation enthält.
Betrachten wir den Fall, in dem Sie nicht programmieren möchten, aber die Konzepte im Zusammenhang mit ML-Aufgaben verstehen. Nun, Uber hat ein AutoML-Tool namens Ludwig für Sie herausgebracht. Es wird über TensorFlow bereitgestellt und ermöglicht es Ihnen, Deep-Learning-Modelle über seine Befehlszeilenschnittstelle (CLI) mit einer einfachen Textdatei und einigen Daten als Eingabe zu erstellen.
Ludwig unterstützt verschiedene Datentypen als Input und Output. Die Architektur eines Modells wird durch eine Kombination von Eingabe- und Ausgabetypen definiert, wobei viele Kombinationen zulässig sind:
Real Plug And Play Supervised Learning Automl Using R And Lares
Um beispielsweise ein einfaches Modell für die Stimmungsanalyse mit dem IMDB-Datensatz zu erstellen, können wir eine config.yml wie folgt erstellen:
Ludwig erstellt für uns einen Ergebnisordner mit Beschreibungen, Wahrscheinlichkeiten und Statistiken. Ein weiteres großartiges Feature ist, dass Sie die Ergebnisse einfach in der Vorschau anzeigen können:
Wenn Sie etwas programmieren möchten, bietet Ludwig auch eine Python-Schnittstelle, die genauso leistungsstark und einfach ist wie das CLI-Tool. Das Tolle an Ludwig ist, dass nur Menschen mit einer Geschäftsperspektive und grundlegenden ML-Konzepten Deep Learning erleben können, ohne Programmieren zu lernen.
Amazon hat AutoGluon eingeführt, um „maschinelles Lernen wirklich zu demokratisieren und allen Entwicklern die Leistungsfähigkeit von Deep Learning zur Verfügung zu stellen“, was bedeutet, dass es bei einigen der schwierigeren Aufgaben des Aufbaus eines Deep-Learning-Modells helfen wird, anstatt nur ein paar Zeilen Code zu erstellen. Zu diesen Aufgaben gehören:
Why Do We Have Automl And Mlops?
Das Paket enthält Beispiele für die Verarbeitung natürlicher Sprache, die Bildklassifizierung und die Objekterkennung. Es enthält keine Visualisierung oder Nutzungsstatistiken, aber die API ist wie Skit-Learn konzipiert und daher leicht verständlich.
Microsoft hat auch ein Tool entwickelt, um den Zugriff auf ML zu demokratisieren: Neural Network Intelligence (NNI), das Zugriff auf eine vollständige Reihe von Tools bietet, darunter:
Und es kann in verschiedenen Umgebungen ausgeführt werden, darunter lokale Maschinen, Remote-Maschinen, Kubeflow, Azure Machine Learning und andere Hybrid Clouds.
NNI funktioniert mit vielen ML-Frameworks und -Bibliotheken (einschließlich scikit-learn, TensorFlow, PyTorch, MXNet XGBoost usw.) und enthält eine CLI, eine Python-API und eine Web-GUI. Es bietet auch viele Beispielszenarien, die sehr einfach auszuführen und mit einfachen Befehlen auszuprobieren sind.
List Of Automl Tools And Software Libraries (april 2020)
Wie Sie sehen können, kann ein von einem lokalen Computer gestartetes Experiment mithilfe der Web-GUI eingerichtet werden, wobei die Ergebnisse “automatisch” in der Webkonsole angezeigt werden. Es erfordert nicht viel Mühe, es in einer anspruchsvolleren Umgebung zu starten.
Die Tsinghua-Universität hat AutoGL als Werkzeug zum Lösen graphbasierter Probleme entwickelt. AutoGL ermöglicht die Automatisierung von:
AutoGL arbeitet auf PyTorch und erstellt einen Solver, der mit einem Zeitlimit parametrisiert werden muss, um den gesamten Prozess abzuschließen. Zukünftige Funktionen wie Graph Boosting und Bagging sowie Link-Vorhersage machen dieses Tool jetzt interessant und zukunftsträchtig.
ML-Projekte sind komplex und zeitaufwändig. Aber die Community hat viele sich wiederholende Aufgaben mit Automatisierungstools bewältigt, die nicht nur Zeit sparen, sondern auch jede Analyse-Pipeline erheblich vereinfachen können.
What Is Automated Machine Learning (automl)?
Natürlich wird kein Tool Erfahrung durch betriebswirtschaftliches Wissen, gesunden Menschenverstand und Daten ersetzen können. Aus diesem Grund sind AutoML-Tools so leistungsfähig: Sie ermöglichen es Personen mit Geschäfts- und Datenhintergrund, die Leistungsfähigkeit von ML zu nutzen, ohne sich mit Algorithmen und Hyperparametern vertraut machen zu müssen. Für diejenigen ohne Geschäfts- oder Datenhintergrund ein letztes Wort der Vorsicht: Bevor Sie diese leistungsstarken Tools verwenden, sollten Sie auf jeden Fall zumindest eine Intuition über die verfügbaren Daten und die Arten von Ergebnissen entwickeln, die Sie erwarten können. Andernfalls können Sie mit Abfall enden.
Auto mercedes ml 270, ml 280 auto, auto mercedes ml 320, ml auto linden, auto mercedes ml, auto ml 350, ml, auto radio mercedes ml, auto mercedes benz ml, ml auto, auto mercedes ml 500, auto mercedes ml 350