AI Cognitive Services - getIT

Artificial Intelligence

AI Cognitive Services

Stellen Sie sich für einen Moment vor, dass dieser Artikel automatisch geschrieben sein könnte, indem einfach das Hauptthema und die Ideen angeben wurden, welche im Artikel reflektiert sein sollten. Danach kann eine KI-Anwendung (Künstliche Intelligenz) gebeten werden, in Sekundenschnelle den Artikel zu erstellen. Vielleicht sind wir gar nicht so weit von dieser Realität entfernt.

Wir erleben eine Explosion von KI-Technologien, die sich schnell von der Forschung zu Massentechnologien entwickeln. Eine der Technologien, die im vergangenen Jahr die meiste Aufmerksamkeit auf sich gezogen hat, liegt im Bereich der generativen KI-Technologien [5], [6]. Genauer gesagt die Technologie, die in der Lage ist, synthetische Bilder, Kunst oder den Stil von Bildern zu verändern, und die in Anwendungen wie DALL-E [7], Nightcafe [8], Midjourney [9], [10] verfügbar ist. Eine einfache Textbeschreibung unseres Bildes kann einschließlich des Stils sofort synthetische Bilder erstellen, die realen Gegenständen oder sogar Kunstwerken sehr nahekommen (Text-zu-Bild => [11], [12]). Nicht nur das, es kann auch den Stil unserer realen Bilder verändern und bestimmte Teile des Bildes retuschieren. Dies ist nur bei generativen KI-Technologien der Fall. KI-Anwendungen wie die automatische Generierung von Texten, Musik, Kunst, Gesichtern, Animationen, die Wiederherstellung alter Filme und die Alterung oder Verjüngung von Gesichtern sind weitere Beispiele in dieser Kategorie. Andere Arten von KI-Technologien umfassen die automatische Kommunikation durch immer ausgefeiltere Chatbots (Conversational AI [13]), automatische Übersetzungssysteme in einer Vielzahl von Sprachpaaren, sowohl geschrieben als auch gesprochen (maschinelle Übersetzung [14]), Empfehlungssysteme [15], natürliche Sprachsysteme zum Extrahieren von Schlüsselsätzen oder Entitäten (NLP KI [16]), automatische Erkennung von Objekten, Inhalten und Personen in Bildern oder Videos (Computer Vision AI [17]) und vieles andere mehr. Von diesen KI-Technologien wird erwartet, dass sie Aufgaben im Zusammenhang mit der Erstellung von Inhalten und der Generierung von Bildern, Videos und Audio vollständig übernehmen. Solche Aufgaben können sich mit der Automatisierung von Prozessen befassen, der Suche, Wiederherstellung und Synthese gespeicherter Informationen, der Erkennung von Personen und Schrift, mit Mensch-Maschine-Kommunikation, aber auch mit komplexeren intellektuellen Aktivitäten im Bereich der Inhalts- und Berichtserstellung und der Gewinnung von Erkenntnissen hohen Wertes für Unternehmen.

"Die Zukunft der KI hat gerade erst begonnen..."

Aber das ist erst der Anfang. Wir werden erstaunt sein, was diese Technologien in den kommenden Jahren für uns tun können. Das Wichtigste ist, dass diese Technologien in kürzester Zeit vom experimentellen zum alltäglichen Gebrauch in unserem Leben und Unternehmen werden. Diese Technologien sind nicht hier, um uns zu ersetzen, sondern um uns bei langweiligen und sich wiederholenden Aufgaben zu helfen. Aufgaben, bei denen der Mensch kognitive Aktivitäten ausführt, die für uns keine Anstrengung bedeuten, aber in unserem täglichen Leben und Geschäft präsent sind. All dies ergibt eine Vielzahl von Möglichkeiten, für die vollständige Digitalisierung von Unternehmen und kann folglich zu großen Einsparungen und Optimierungen von Geschäftsprozessen führen [18], [19]. Jüngste Studien zeigen zum Beispiel, dass KI-gestützte Anrufagenten in den nächsten drei Jahren die Menschen in 15 % der Kundenkommunikation ersetzen werden, was einer geschätzten Einsparung von 80 Milliarden US-Dollar entspricht [20]. Viele der oben genannten KI-Technologien werden bereits als Cognitive Services in der Cloud, über die REST-API oder auf andere Weise genutzt. Sie werden schnell zu Gebrauchsgegenständen und können von normalen Menschen und Unternehmen genutzt werden.

Doch wie kann ich diese KI-Technologien in meinem Unternehmen einbinden? Wie können mir all diese kognitiven Dienste und KI in meinem Geschäft, bei neuen Kundenbedürfnissen und bei der Prozessoptimierung helfen? Die Antwort ist, dass viele Unternehmen bereits über die Daten und den Zugang zu den notwendigen Technologien verfügen, um diese kognitiven KI-Dienste zur Unterstützung ihrer Geschäfte zu nutzen. Viele Unternehmen haben vor langer Zeit damit begonnen, Daten zu sammeln und Big-Data-Technologien einzusetzen. Viele dieser Daten bleiben in Data Lakes oder ähnlichen digitalen Speichern gespeichert, ohne dass sie erforscht oder genutzt werden. In diesen Quellen steckt ein großes Potenzial, wenn Big Data Analytics und AI Cognitive Services-Technologien verwendet werden. Eine einzige Quelle oder eine Kombination aus mehreren reicht aus, um viele Anwendungsfälle durchzuführen und Prozesse zu optimieren. Beispielsweise könnte dasselbe Streaming-Video von Kameras vor Ort unterschiedlichen Zwecken dienen. Es kann für die automatische Erkennung von Eindringlingen, die Sicherheit von Personen in gefährlichen Umgebungen, die automatische Berichterstattung über industrielle Aktivitäten und Bestände, die Produktionssichtung und die Fehlererkennung wiederverwendet werden. In diesen Fällen würden die kognitiven Dienste des maschinellen Sehens die meisten Aufgaben übernehmen. Als weiteres Beispiel kann eine einzelne Quelle von Dokumenten, Texten oder schriftlichen Mitteilungen für die automatische Dokumentenklassifizierung, Dokumentenzuordnung, Zusammenfassung und Extraktion wichtiger Ideen oder Schlüsselwörter verwendet werden. Es kann auch als Informationsquelle bei intelligenten Suchen verwendet werden. In all diesen Fällen werden kognitive KI-Dienste für Sprache eine große Hilfe bei der Entwicklung von Lösungen sein.

Und wie gut stehen Unternehmen heute in Bezug auf KI-Technologien und Cognitive Services da? Nutzen Unternehmen all diese Technologien, um ihr Geschäft und ihre Kundenbeziehungen wirklich zu verbessern? Die Realität ist, dass vielen Unternehmen eine konsistente Vision und Strategie in Bezug auf die Nutzung von Big Data Analytics, KI und Cognitive Services fehlt. Viele Firmen sind schlichtweg gescheitert oder kämpfen jetzt darum, den Einsatz solcher Technologien in ihrem Geschäft aufrechtzuerhalten [21], [22], [23]. Die Gründe, warum viele Unternehmen beim Einsatz von KI- und Big-Data-Technologien nicht erfolgreich sind, sind vielfältig. Eine der Erklärungen ist, dass sich viele Unternehmen auf die Lösung von Einzelfällen oder höchstens mehreren ähnlichen Fällen konzentrieren. Unternehmen entwickeln Datenpipelines und KI-Modelle von Grund auf neu und in den meisten Fällen unter Verwendung von Open-Source-Technologien. Daher ist der Aufwand, ihr Framework an neue KI-Technologien oder neue Daten anzupassen, KI-Modelle zu aktualisieren und die Infrastruktur zu warten, so groß, dass es auf lange Sicht nicht tragbar ist. Andere Ursachen haben damit zu tun, dass in vielen Fällen weder die Daten noch die Datenvorverarbeitung dem Business Case angemessen waren. Neuere Studien zeigen auch, dass mehr als die Hälfte der Unternehmen (58 %) sich auf die Lösung der sogenannten „Need-to-Do“-Fälle konzentrieren und nur 46 % der Unternehmen die „Must-dos“ ausführen, die großen Nutzen bei wenig Komplexität bringen [24].

(Capgemini: https://www.capgemini.com/gb-en/wp-content/uploads/sites/3/2017/09/dti-ai-report_final1-1.pdf(öffnet ein neues Fenster))

Es besteht auch das Problem, dass versucht wird, Anwendungsfälle um Daten analogen Ursprungs herum aufzubauen, anstatt Systeme auf die Verwendung rein digitaler Daten umzugestalten. Zum Beispiel handschriftliche Texte, eingescannte Dokumente oder handschriftlich ausgefüllte Formulare. Es ist auch wichtig zu berücksichtigen, dass sich all diese KI-Technologien sehr schnell entwickeln, was hochspezialisierte Fachleute, aktuelles und technisches Wissen sowie die kontinuierliche Aktualisierung von KI-Frameworks erfordert. Dies wiederum bedeutet für die Unternehmen einen sehr hohen Aufwand im Verhältnis zum Nutzen. Deshalb haben einige Firmen Projekte im Bereich der KI aufgegeben, deren Nutzen die enorme Investition nicht rechtfertigte. Kurz gesagt, viele Unternehmen haben eine Vielzahl von Ingenieuren eingestellt und enorme Geldbeträge für Ressourcen ausgegeben sowie ihre eigenen Systeme von Grund auf neu entwickelt, ohne über eine solide Big-Data-Strategie oder ROI-Prognosen zu verfügen. 

KI und ihre kognitiven Dienste sind lediglich Werkzeuge in einer Business-Toolbox. Tools, die durch Erkenntnisse extrahieren, komplexe Muster finden oder Prozesse optimieren. Wir können nicht vorgeben, alle Fälle allein mit diesen Technologien zu lösen, ohne die Daten und das Geschäft zu kennen. Versuchen Sie weder, isolierte Probleme zu lösen, die Teil einer viel größeren digitalen Einheit sind, noch verwenden Sie analoge Informationen in einer digitalen Welt. Das Potenzial dieser Hightechs ist noch lange nicht ausgeschöpft. Unternehmen leisten immer noch Widerstand gegen den massiven und systematischen Einsatz von KI-Technologien, wo sie eine herausragende Rolle spielen können, wenn es darum geht, Prozesse zu optimieren, Erkenntnisse zu gewinnen und Muster kontinuierlich zu finden (AI Augmented Analytics [25]). Die neue digitale Revolution wird von diesen KI-Technologien ausgehen, wenn sie in unserem täglichen Leben massiv eingesetzt werden. 

Doch wie kann ich Innovation und digitale Transformation in Unternehmen beschleunigen, ohne die oben genannten Probleme zu haben? Die Antwort liegt in der Nutzung von kognitiven KI-Diensten in der Cloud [26], die sich in ständiger Entwicklung befinden, als Tools einsatzbereit sind, nur minimalen Aufwand für die Inbetriebnahme erfordern und in ähnlichen Fällen problemlos wiederverwendet werden können. KI-kognitive Dienste in der Cloud ermöglichen es, die fortschrittlichste KI-Technologie in den Dienst der Digitalisierung und Optimierung von Unternehmen zu stellen. Sie ermöglichen die Industrialisierung dieser Art von KI für das gesamte Unternehmen und erlauben eine tiefgreifende digitale Transformation auf allen Ebenen. Es eliminiert Widerstände und schlechte Prozesse. Sie automatisieren und vereinfachen Abläufe und Datenverarbeitung. Aber meistens führen sie wiederholende und langweilige menschliche kognitive Aufgaben durch. Der flächendeckende Einsatz dieser Technologien in allen Bereichen wird Unternehmen effizienter machen und somit ihre Ausgaben reduzieren. Wenn es einen Prozess gibt, der optimiert oder automatisiert werden kann, werden Unternehmen keine andere Wahl haben, als diese Technologien zu nutzen, wenn sie eine vollständige digitale Transformation durchführen und ein datengesteuertes Unternehmen sein wollen.

(Azure: https://azure.microsoft.com/en-us/products/cognitive-services/(öffnet ein neues Fenster))

Im Fall von Azure Cognitive Services [27] können wir derzeit fünf Hauptkategorien von Diensten unterscheiden. Solche, die mit Sprechen, Sprache und Sehen und dem Treffen intelligenter Entscheidungen zu tun haben, sowie eine zusätzliche Kategorie, die sich derzeit in der Vorschau befindet und es Unternehmen ermöglicht, die neueste Generation von groß angelegten KI-Modellen zu verwenden. Diese Dienste verwenden mit Big Data vortrainierte KI-Modelle, die wiederum für unsere spezielle Verwendung angepasst werden können, indem wir unsere eigenen Daten mit minimalem Aufwand hinzufügen. Außerdem können kognitive KI-Dienste miteinander oder mit anderen Cloud-Diensten kombiniert werden, um Lösungen zu entwickeln, die sich vollständig an unsere Bedürfnisse anpassen. Und vor allem ermöglichen sie die Wiederverwendung von Systemen in anderen ähnlichen Prozessen sowie das Training derselben Datenquelle für andere Anwendungsfälle.

Die derzeit in Azure verfügbaren kognitiven KI-Dienste nach Kategorie sind:

  • Sprache: Sprache zu Text, Text zu Sprache, Sprachübersetzung, Sprechererkennung
  • Sprache: Entitätserkennung. Stimmungsanalyse. Fragen beantworten. Verstehen von Konversationssprache. Übersetzer.
  • Vision: Computer Vision, benutzerdefinierte Vision, Gesichts-API
  • Entscheidung: Anomaliedetektor, Inhaltsmoderator, Personalisierer
  • OpenAI-Dienst

Wie bereits erwähnt, befinden sich diese Dienste in ständiger Entwicklung und Erweiterung. (Weitere aktuelle Informationen sind in der offiziellen Dokumentation zu finden: [28]) 

Einer unserer jüngsten Fälle des Einsatzes von kognitiven KI-Diensten, der eine ziemliche Erfolgsgeschichte war, hat mit dem automatischen Melden des Einsatzes von Baumaschinen im Eisenbahnsektor zu tun. Der Kunde speicherte Videoaufzeichnungen von all seinen Überwachungskameras von mehr als 200 verschiedenen Standorten. Videomaterial wurde lediglich zur Überwachung und Sicherheit der Infrastruktur verwendet. 

Dank Speichertechnologien und kognitiven KI-Diensten für maschinelles Sehen in der Azure-Cloud konnten wir ein automatisiertes System implementieren, das nicht nur den Maschinentyp und die Betriebsstunden erkennt, sondern sogar das Modell der Maschine melden kann mit einer Genauigkeit von über 95%. 

Das System vermeidet, den Einsatz von Baumaschinen manuell zu melden, was es effizienter und präziser im Vergleich zum Menschen macht. 

Dieselbe Datenquelle wurde später wiederverwendet, um mit minimalem zusätzlichen Entwicklungsaufwand vor menschlicher Anwesenheit in gefährlichen Gebieten zu warnen. 

In anderen Fällen haben wir diese kognitiven KI-Technologien verwendet, um Rechtsdokumente automatisch zu klassifizieren. Für ein anderes Unternehmen konnten wir einen PoC (proof of concept) durchführen, der aufzeigte, dass die Identifizierung und der Abruf von Hand ausgefüllten Feldern in CC-Formularen möglich war. Auch wenn die Modelle eine sehr hohe Genauigkeit aufwiesen, wurde empfohlen, die Verwendung analoger Informationen in unseren Lösungsvorschlägen nach Möglichkeit zu vermeiden.

Über Swisscom Data & Analytics

Swisscom Data & Analytics unterstützt Geschäftskunden bei der Beratung, Konzeption, Integration und Wartung von analytischen Informationssystemen wie Data Lakes, Data Warehouses, Dashboards, Reporting und ML/AI-Lösungen auf Basis ausgewählter Technologien von Microsoft, AWS, SAP, Open Source und mehr. Mehr als 50 engagierte Daten- und Analyseexperten unterstützen unsere Kunden in verschiedenen Branchen täglich, um sie zu echten datengesteuerten Unternehmen zu machen.

Über den Autor

Sergio Jimenez ist Senior Data & Analytics Consultant bei Swisscom, spezialisiert auf Advanced Analytics. Seit seinem Eintritt bei Swisscom im Jahr 2016 hat Sergio an zahlreichen Projekten für mehrere Kunden gearbeitet, die von Business Intelligence bis hin zu AI/ML reichen. Er hat erfolgreich innovative Lösungen mit den neuesten Technologien entwickelt.

Referenzen:

[1] Big Data Analytics. IBM. Accessed Sep 2022. https://www.ibm.com/analytics/big-data-analytics(öffnet ein neues Fenster)

[2] Artificial Intelligence. IBM. Accessed Sep 2022. https://www.ibm.com/design/ai/basics/ai/(öffnet ein neues Fenster)

[3] Machine learning. IBM. Accessed Sep 2022. https://www.ibm.com/design/ai/basics/ml(öffnet ein neues Fenster)

[4] What is data lake. Microsoft. Accessed Sep 2022. https://azure.microsoft.com/en-us/resources/cloud-computing-dictionary/what-is-a-data-lake/(öffnet ein neues Fenster)

[5] https://hbr.org/2022/11/how-generative-ai-is-changing-creative-work(öffnet ein neues Fenster)

[6] https://research.ibm.com/interactive/generative-models/(öffnet ein neues Fenster)

[7] https://openai.com/dall-e-2/(öffnet ein neues Fenster)

[8] https://creator.nightcafe.studio/(öffnet ein neues Fenster)

[9] https://www.midjourney.com/(öffnet ein neues Fenster)

[10] https://beincrypto.com/learn/ai-image-generators/#h-1-midjourney(öffnet ein neues Fenster)

[11] https://deepai.org/machine-learning-model/text2img(öffnet ein neues Fenster)

[12] https://www.forbes.com/sites/robtoews/2022/09/11/4-hot-takes-about-the-wild-new-world-of-generative-ai/?sh=de02c5913d93(öffnet ein neues Fenster)

[13] https://www.ibm.com/cloud/learn/conversational-ai(öffnet ein neues Fenster)

[14] https://aws.amazon.com/what-is/machine-translation/(öffnet ein neues Fenster)

[15] https://www.sciencedirect.com/science/article/pii/S1110866515000341(öffnet ein neues Fenster)

[16] https://www.ibm.com/cloud/learn/natural-language-processing(öffnet ein neues Fenster)

[17] https://www.ibm.com/topics/computer-vision(öffnet ein neues Fenster)

[18] https://www.forbes.com/sites/forbesbusinesscouncil/2022/11/21/the-top-five-ways-ai-is-transforming-business/(öffnet ein neues Fenster)

[19] https://techvera.com/6-ways-artificial-intelligence-can-cut-business-costs/(öffnet ein neues Fenster)

[20] https://techmonitor.ai/technology/ai-and-automation/call-centre-ai(öffnet ein neues Fenster)

[21] https://venturebeat.com/ai/why-do-87-of-data-science-projects-never-make-it-into-production/(öffnet ein neues Fenster)

[22] https://odsc.medium.com/machine-learning-challenges-you-might-not-see-coming-9e3ed893491f(öffnet ein neues Fenster)

[23] https://www.forbes.com/sites/cognitiveworld/2022/08/07/you-need-to-stop-doing-this-on-your-ai-projects/?sh=3ce505244c99(öffnet ein neues Fenster)

[24] https://www.capgemini.com/gb-en/wp-content/uploads/sites/3/2017/09/dti-ai-report_final1-1.pdf(öffnet ein neues Fenster)

[25] https://powerbi.microsoft.com/en-us/augmented-analytics/(öffnet ein neues Fenster)

[26] https://digital6.tech/artificial-intelligence-ai-cognitive-services(öffnet ein neues Fenster)

[27] https://azure.microsoft.com/en-us/products/cognitive-services/(öffnet ein neues Fenster)

[28] https://azure.microsoft.com/en-us/products/cognitive-services/openai-service/#features(öffnet ein neues Fenster)

Sergio Jimenez-Otero

Sergio Jimenez-Otero

Senior Data & Analytics Consultant

Mehr getIT-Beiträge

Bereit für Swisscom

Finde deinen Job oder die Karrierewelt, die zu dir passt. In der du mitgestalten und dich weiterentwickeln willst.

Was du draus machst, ist was uns ausmacht.

Zu den Karrierewelten

Zu den offenen Security Stellen