Warum Salesforce die KI-Technologie hinter Einstein frei verfügbar macht

Der CRM-Anbieter stellt die Machine-Learning-Technologie seiner Einstein-Plattform öffentlich zur Verfügung. [...]

Maschinelles Lernen hat das Potenzial, das Business zu verändern. (c) GDJ pixabay
Maschinelles Lernen hat das Potenzial, das Business zu verändern. (c) GDJ pixabay

TransmogrifAI, die AutoML-Bibliothek, enthält weniger als 10 Zeilen Scala-Code auf Apache Spark und kann von Entwicklern verwendet werden, die Maschinenlernmodelle trainieren, um Kundenverhalten vorherzusagen, ohne einen großen Datensatz für das Training verwenden zu müssen.

„Es wurde mit dem Fokus entwickelt, die Produktivität von Entwicklern durch Machine LearningAutomatisierung zu erhöhen und eine API zu implementieren, die etwa Modularität und Wiederverwendung sicherstellt. Durch Automatisierung erreicht das System eine Genauigkeit, die an manuelle Modelle heranreicht, aber mit fast hundertfacher Zeiteinsparung“, heißt es auf der Website von Salesforce.

In einem Beitrag von letzter Woche schrieb Shubha Nabar, leitender Direktor für Data Science beim Salesforce Einstein-Team: „Vor drei Jahren, als wir begannen, Machine Learning-Funktionen in die Salesforce-Plattform zu integrieren, mussten wir erfahren, dass Machine Learning-Systeme im großen Maßstab sehr schwierig sind.“

Der Schlüssel für Salesforce bei der Entwicklung von Einstein bestand darin, intelligente Erkenntnisse und Empfehlungen liefern zu können, ohne alle Daten des Kunden zusammenzufassen zu müssen. Dies war eine ziemlich große Herausforderung für den Hersteller gewesen, bevor er eine Reihe von Spezialisten für maschinelles Lernen erwarb, darunter MetaMind und sein Gründer Richard Socher, der heute als leitender Wissenschaftler bei Salesforce tätig ist.

„Wir haben riesige Datenmengen, Petabyte um Petabyte, also haben wir die Daten, die wir brauchen, und die Antwort ist, dass wir jetzt mit diesen Daten arbeiten können, ohne die Vertrauensbeziehung zu unseren Kunden zu stören“, sagt Salesforce-CEO Marc Benioff.

Nabar schreibt dazu: „Wir müssen kundenspezifische Machine-Learning-Modelle für jeden beliebigen Anwendungsfall erstellen. Selbst wenn wir globale Modelle erstellen könnten, macht dies absolut keinen Sinn, weil die Daten jedes Kunden einzigartig sind und unterschiedliche Schemata haben, verschiedene Formate, die durch verschiedene Geschäftsprozesse bedingt sind. Um Machine Learning wirklich für unsere Kunden nutzbar zu machen, müssen wir Tausende von personalisierten Maschinenlernmodellen aufbauen und einsetzen, die auf die Daten jedes einzelnen Kunden für jeden einzelnen Anwendungsfall trainiert werden. Die einzige Möglichkeit, dies zu erreichen, ohne eine Armee von Datenwissenschaftlern zu beschäftigen, ist die Automatisierung. Die meisten AutoML-Lösungen sind heute entweder sehr eng auf einen kleinen Teil des gesamten Machine Learning-Workflows ausgerichtet oder sind für unstrukturierte, homogene Daten für Bilder und Sprache ausgelegt. Wir brauchten aber eine Lösung, mit der schnell dateneffiziente Modelle für heterogene, strukturierte Daten in großem Maßstab erstellt werden können.“

Die Lösung besteht darin, ein einzelnes, modulares Modell zu erstellen, das über kleinere, personalisiertere Datensätze hinweg funktioniert und den Eindruck mehrerer domänenspezifischer Modelle vermittelt. „Mit nur wenigen Codezeilen kann ein Data Scientist die Datenbereinigung, das Feature-Engineering und die Modellauswahl automatisieren, um zu einem performanten Modell zu gelangen, von dem aus weitergearbeitet werden kann“, erklärt Nabar.

„TransmogrifAI bedeutete für uns eine Transformation und ermöglichte es unseren Datenwissenschaftlern, Tausende von Modellen mit minimalem manuellen Tuning produktiv einzusetzen und die durchschnittliche Bearbeitungszeit für das Training eines performanten Modells von Wochen auf wenige Stunden zu verkürzen.“

Nabar ergänzt: „Dieser Grad an Automatisierung war für uns unverzichtbar, um für Unternehmenszwecke skaliert werden zu können. Wir glauben jedoch, dass heutzutage jedes Unternehmen mehr Machine Learning-Fälle als Data Scientists hat und Automatisierung der Schlüssel ist, um die Macht des maschinellen Lernens nutzen zu können.“

Um zu erklären, warum sich Salesforce entschieden hat, dieses Projekt in die Open-Source-Community einzubringen, sagt Nabar: „Salesforce war ein langjähriger Anwender und Mitwirkender von Apache Spark und wir freuen uns, TransmogrifAI weiterhin gemeinsam mit der Community aufzubauen. Maschinelles Lernen hat das Potenzial, das Business zu verändern. Wir sind der Meinung, dass Barrieren für die Akzeptanz nur durch einen offenen Austausch von Ideen und Code verringert werden können. Indem wir im Open Source-Umfeld arbeiten, können wir verschiedene Perspektiven zusammenbringen, um die Technologie weiter voranzutreiben und es für alle zugänglich zu machen.“

*Scott Carey ist Redakteur der Computerworld UK.


Mehr Artikel

Stijn Bannier, Digital Product Manager, Open API.
News

Air France-KLM erklimmt mit API neue Höhen

Air France-KLM hat mit TIBCO Cloud Integration und TIBCO Cloud Mashery Software eine API-geführte, kundenzentrierte Strategie umgesetzt. Sie verknüpfte ihre riesige Anwendungs- und Datenumgebung, um Partnern, Entwicklern und Endbenutzern ein reibungsloses Erlebnis zu bieten – und dem Unternehmen die Fähigkeit zur agilen Veränderung. […]

Palo Stacho, Mitgründer und Head of Operations bei Lucy Security (c) Lucy Security
Kommentar

Die fünf Mythen von simulierten Phishing-Nachrichten

Das Schweizer Unternehmen Lucy Security hat in einer weltweiten Onlinestudie „Nutzen und Herausforderungen von Cybersecurity-Awareness 2020“ im Juni 2020 Unternehmen nach dem praktischen Nutzen und den Herausforderungen von Cybersecurity-Awareness befragt. Aufgrund dieser Studie räumt Palo Stacho, Mitgründer und Head of Operations bei Lucy Security, mit fünf Mythen auf. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*