Seit Jahrzehnten nutzen Softwareentwickler Debugger und Profiler, um versteckte Fehler in ihrem Code aufzuspüren. In der Fertigung hingegen stehen uns oft nichts als eine Stoppuhr und ein Notizblock zur Verfügung, wenn ein Prozess ausfällt oder langsamer wird.

In der neuesten Folge von „Humans in the Loop“ sprechen Tulip Rony Kubat und Mark Watabe, Leiter der KI-Produktentwicklung, mit CMO Madi Castillo darüber, wie sich dies derzeit verändert.

Ausgehend von ihrem Hintergrund in den Bereichen Architektur, Film und Softwareentwicklung erörtert das Team die Entstehung der „Physical Observability“ – den Einsatz von Vision Language Models (VLMs), um die physische Welt der Fabrik ähnlich wie Code zu „profilieren“ und Videos so von einem passiven Speichermedium in ein aktives Werkzeug für kontinuierlicher Verbesserungsprozess zu verwandeln.

Sehen Sie sich die gesamte Folge unten an:

Die Kontextlücke: Kochen für die Großmutter vs. Fernsehen

Daten ohne Kontext sind nur Rauschen. Um zu erklären, warum das so ist, greifen Mark und Rony auf eine allgemein verständliche Analogie zurück: das Kochen.

Wenn Sie ein Essen zum 100. Geburtstag Ihrer Großmutter zubereiten, ist dieser Vorgang von Sorgfalt, Tradition und vielleicht einem etwas gemächlicheren Tempo geprägt. Wenn Sie genau dasselbe Essen für einen Live-Fernsehwettbewerb zubereiten, ist dieser Vorgang von Schnelligkeit, Leistung und Stress geprägt.

Ein einfacher Temperatursensor am Herd würde in beiden Fällen 350 °F anzeigen. Er kann den Unterschied nicht erkennen. Die tatsächlichen Betriebsbedingungen sehen jedoch ganz anders aus.

„Der Architekt setzt sich mit dem problematischen Maßstab auseinander, nämlich dem menschlichen Maßstab … Bei LLMs verhält es sich genauso. Wir wünschen uns unendlichen Kontext, doch diesen gibt es nicht. Man muss einen referenziellen Kontext entwerfen, damit die KI weiß, wohin sie sich orientieren soll.“ – Mark Watabe

In der Fertigung leiden wir oft unter dieser „Kontextlücke“. Wir verfügen zwar über die Sensordaten (die Maschine läuft), doch fehlt uns der menschliche Kontext (wer bedient sie, warum hat er Schwierigkeiten und wie sieht die Umgebung aus?). Um diese Lücke zu schließen, bedarf es einer neuen Art von Sensor – eines, der das Gesamtbild erfassen kann.

Zur physikalischen Beobachtbarkeit

Rony stellt das Konzept des Software-Profilers vor – ein Tool, das die Ausführung eines Programms überwacht und genau aufzeigt, an welchen Stellen der Code verzögert wird oder abstürzt.

In der Fertigung entspricht dies der physischen Beobachtbarkeit. Es geht nicht nur darum, Videos aufzuzeichnen, sondern darum, mithilfe von KI die Vorgänge im Video zu verstehen.

Mit dem Aufkommen von Vision Language Models (VLMs) können Hersteller nun ihre Videoaufzeichnungen „abfragen“. Anstatt dass ein Mitarbeiter acht Stunden Filmmaterial durchsehen muss, um einen Stau zu finden, können sie einen Agenten fragen: „Zeigen Sie mir alle Stellen, an denen der Gabelstapler in Schicht A den Gang blockiert hat.“

Dadurch können Betriebsleiter ihre physischen Prozesse mit derselben Präzision „debuggen“, wie Softwareentwickler ihren Code debuggen.

Von der Überwachung zur Unterstützung: Die „Handstand“-Metapher

Ein häufiger Einwand gegen Kameras in der Fertigung ist die Angst vor dem „Big Brother“ – dass das Videomaterial dazu genutzt wird, Mitarbeiter zu bestrafen. Mark kehrt diese Sichtweise mit einer persönlichen Metapher um: dem Erlernen des Handstands.

Wenn Sie lernen möchten, einen Handstand zu machen, ist eine Kamera das wertvollste Hilfsmittel, das Sie haben können. Sie filmen sich nicht, um beurteilt zu werden, sondern um zu sehen, was Sie nicht spüren können – ist Ihr Rücken gewölbt? Sind Ihre Ellbogen angewinkelt?

Dies ist der Kern der menschenzentrierten KI. Wenn die physische Beobachtbarkeit richtig eingesetzt wird, passt sie den Arbeitsplatz an den Mitarbeiter an, anstatt den Mitarbeiter zu zwingen, sich an den Arbeitsplatz anzupassen. Sie erkennt, wo die Ergonomie zu wünschen übrig lässt, wo Werkzeuge außer Reichweite sind und wo der Prozess dem Menschen entgegenwirkt – und ermöglicht so eine individuelle Anpassung des Arbeitsablaufs an den Einzelnen.

Nutzen Sie eine menschenorientierte KI, um die Produktion mithilfe einer vernetzten Betriebsplattform zu optimieren

Erfahren Sie, wie Hersteller Tulip einsetzen, Tulip Echtzeitdaten aus der Fertigung Tulip erfassen, Arbeitsabläufe zu standardisieren und die betriebliche Grundlage zu schaffen, die KI-Systeme benötigen, um Qualität, Durchsatz und Entscheidungsfindung zu verbessern.

Illustration eines Tages im Leben