KI-Training durch Crowdsourcing

Schon seit vielen Jahrzehnten sind künstliche Intelligenzen, die dem Menschen in Kreativität und Flexibilität in nichts nachstehen und ihm als geistig überlegener Begleiter zur Seite stehen, fester Bestandteil von Film und Fernsehen. Auch in unserer heutigen Wirklichkeit ist der Begriff KI längst angekommen, wenn etwa von autonomem Fahren, intelligenter Prozesssteuerung in der Industrie oder Chatbots im Kundendienst die Rede ist. Anders als die fiktiven künstlichen Intelligenzen auf der großen Leinwand müssen die heutigen neuronalen Netzwerke jedoch mühsam an ihre Aufgaben angelernt werden. Führend sind hier Experten, welche die Netzwerke verwalten, Lösungen implementieren und an neuen, noch fortschrittlicheren Algorithmen forschen. Auf Zeit gerechnet verschwindet jedoch ihr Beitrag neben der gewaltigen Menge an Arbeit, die der KI die notwendigen Trainingsdaten zuführen und die Ergebnisse auswerten und überwachen. Diese zeitaufwendigen, aber ohne Studium oder Fachausbildung zu bewerkstelligenden Arbeitsschritte werden heutzutage vor allem durch die Crowd, also durch eine große Anzahl selbstständiger Arbeiter, ausgeführt. Hier erfahren Sie, wie das KI-Training von Crowdsourcing profitiert und zahlreiche Zukunftstechnologien durch diese Kleinstarbeit erst möglich gemacht werden. Neben Beispielen aus der Welt der Mobilität und des Kundenservice erfahren Sie auch, welche Vorteile das Crowdsourcing gegenüber dem KI-Training mit unternehmenseigenen Ressourcen bietet.


Wenn Maschinen sehen lernen – Bildanalyse KI-Training durch Crowdsourcing

Schon heute sind Features wie Spurhalteassistent, Bremsassistent oder Einparkhilfe fester Bestandteil zahlreicher Serienautos. Auch die Entwicklung von vollständig selbsttätig fahrenden Autos liegt in greifbarer Nähe und wird von zahlreichen Autokonzernen erforscht. Dabei ist die korrekte Wahrnehmung der Umgebung mindestens genauso wichtig wie die Entwicklung der KI, die auf diese Umgebung mit den korrekten Aktionen reagiert. Nur durch eine akkurate Interpretation der Sensordaten, die von Kameras und Abstandsmessern auf Basis von Ultraschall oder LIDAR erzeugt werden, kann das Auto die korrekten Entscheidungen treffen und seine Passagiere sicher ans Ziel bringen. Damit ein Auto erkennt, ob ein rundliches, rotes Objekt ein Ball, ein Stoppschild oder eine rote Ampel ist oder welche Muster heller und dunkler Pixel für die unterschiedlichen Straßenmarkierungen auf dem Asphalt stehen, müssen diese Informationen händisch aufbereitet werden. Je nach gewünschtem Detailgrad gibt es hier mehrere Möglichkeiten. So umrahmen Crowdworker auf Straßenverkehrsbildern Leitlinien, ziehen um bestimmte Elemente Kästen oder Boxen oder färben das gesamte Bild in unterschiedlichen Farben, die für Elemente wie Autos, Fußgänger, Straßenschilder oder Ampeln stehen. Durch ein exaktes Qualitätsmanagement dieser Daten können so Bild- und Videoaufnahmen erzeugt werden, die für eine künstliche Intelligenz leicht interpretierbar sind und zu ihrem Training herangezogen werden können. Nicht nur Autos profitieren davon, wenn ihnen durch die Crowd das „Sehen“ beigebracht wird. Auch KIs für Schiffe, Flugzeuge und Drohnen können von diesen Daten lernen und ihren Bedienern zahlreiche Aufgaben abnehmen oder autonom agieren. Daneben können auch Kameras selbst eine wertvolle Aufgabe übernehmen, etwa im Sicherheitsbereich oder bei der Analyse von Verkehrsdaten zur Verbesserung von Ampelschaltungen. In der Qualitätskontrolle in der Landwirtschaft können schadhaftes Obst und Gemüse aussortiert und Pflanzen automatisch abgeerntet werden, in der Lebensmittelindustrie wird der Bräunungsgrad von Gebäck erfasst und die Ofentemperatur reguliert und in der Medizin können künstliche Intelligenzen Gewebeproben und Hautbilder selbstständig bewerten. All diese vielfältigen Anwendungen basieren auf Trainingsdaten, die von Crowdworkern durch Labeln von Bildern aufbereitet und der KI so verständlich gemacht werden.



Der digitale Kundendienst – Chatbot KI-Training durch Crowdsourcing

Eine weitere wichtige Art von KI, die schon heute in vielen Unternehmen eingesetzt werden, sind sogenannte Chatbots. Diese Programme treten etwa im Bereich des Kundendienstes als erster Kontakt mit Kunden, Zulieferern oder Partnern in Verbindung, beantworten Fragen und leiten die Anfragen an die richtige Adresse im Unternehmen. Diese Algorithmen verringern so den Bedarf an Mitarbeitern im Kundendienst, vermeiden ärgerliche Warteschleifen und verbessern die Kundenbindung. Während die einfachsten Programme die Sätze des Gesprächspartners nach Schlüsselwörtern absuchen und entsprechend dieser Wörter vorgefertigte Antworten ausgeben, sind höherwertige Chatbots in der Lage, Probleme aus dem Kontext zu verstehen und zahlreiche synonyme Fragestellungen zuzuordnen. Auch in diesem Bereich leistet die Crowd wertvolle Arbeit. Ein Mensch ist, im Gegensatz zu einer KI, in der Lage, Zusammenhänge schnell zu erfassen und diese bestimmten Bereichen zuzuordnen. So kann eine Kundenanfrage schnell der passenden Kategorie wie „Beschwerde“, „Stornierungsanfrage“ oder „Terminanfrage“ zugeordnet werden. Anhand dieser gelabelten Daten kann ein Algorithmus trainiert werden, diese Zusammenhänge selbstständig zu erfassen. Auch nach diesem Training ist die Arbeit der Crowd nicht getan, denn die teils Hunderttausenden Trainingsdaten müssen einer Qualitätskontrolle unterzogen werden. Durch die Bewertung, ob eine Zuordnung korrekt oder falsch erfolgte, können Schwachstellen in den Algorithmen identifiziert und ausgebessert werden. Bei der Generierung von Trainingsdaten gibt es ebenfalls viel zu tun, etwa wenn es um die Erzeugung von Synonymen von Kundenanfragen geht. Jeder Mensch hat eine eigene Art, sich auszudrücken und Fragen zu formulieren. Durch die heterogene Zusammensetzung der Crowd wird ein gutes Bild möglicher Kunden erzeugt. Eine ähnliche Art von Training erfordern Algorithmen, die Content moderieren. Zahlreiche Plattformen in Social Media, aber auch im klassischen Journalismus, auf Bewertungsplattformen und vielen weiteren Beispielen bieten ihren Benutzern die Möglichkeit, eigene Kommentare zu verfassen. Um zu verhindern, dass diese Möglichkeit von Trollen ausgenutzt wird, um Unfrieden zu stiften, prüfen Algorithmen die Texte und sortieren unerwünschte Inhalte aus. Auch hier hilft die Crowd dabei, Beispielsätze zu generieren, bestehende Kommentare zu labeln und die Arbeit der KI zu kontrollieren.


KI-Training durch Crowdsourcing und seine Vorteile

Theoretisch können alle Arbeiten, die für das Training einer künstlichen Intelligenz erforderlich sind, auch durch unternehmenseigene Ressourcen durchgeführt werden. Der Umfang dieser Arbeiten macht solche Versuche jedoch selbst für große Unternehmen nicht praktikabel. Für das Training von Algorithmen werden je nach Komplexität der Aufgabe zwischen 10.000 und 1.000.000 Datenpunkte benötigt. Um diese Arbeit in absehbarer Zeit auszuführen, müsste ein Unternehmen Hunderte, wenn nicht Tausende Mitarbeiter entweder von anderen Bereichen abstellen oder befristet einstellen. Durch die Zusammenarbeit mit Partnern, die Crowdsourcing ermöglichen, können Unternehmen auf bereits bestehende, heterogene Arbeiter zurückgreifen. Auch die Notwendigkeit eines Aufbaus einer entsprechenden Infrastruktur zur Durchführung der Aufgaben und der Qualitätskontrolle entfällt. Die Vorteile für ein Unternehmen sind neben der Heterogenität der Datensätze eine schnelle Bearbeitung und große Kostenersparnisse. Der Skalierbarkeit der einzelnen Aufgaben ist kaum eine Grenze gesetzt, werden die Aufträge doch von den Crowdsourcing Plattformen auf einzelne Jobs heruntergebrochen, die unabhängig bearbeitet werden. Die vollständigen Datensätze werden daraufhin von der Plattform auf ihre Qualität kontrolliert und so aufbereitet, dass diese direkt für die KI-Entwicklung genutzt werden können. Dies beschleunigt im Unternehmen die Entwicklungszeit und macht wertvolle Personalressourcen im Bereich der KI-Entwicklung für das Kerngeschäft des Programmierens und der Weiterentwicklung der Algorithmen frei.


Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.