Home » B2B E-Commerce » Bessere Produktdaten durch automatisierte Auswertung von Datenblättern 
Hände tippen auf Smartphone und Laptop und Shopping-Fenster sind geöffnet

Bessere Produktdaten durch automatisierte Auswertung von Datenblättern 

Erfolgreicher E-Commerce benötigt eine solide, vollständige Datenbasis für die angebotenen Produkte. Doch gerade im B2B-Segment sind umfassende Produktdaten eine große Herausforderung. Im Blogbeitrag stellen wir eine innovative, KI-gestützte Lösung von netz98 zur automatischen Datenanreicherung vor und präsentieren anhand eines Praxisbeispiels ihren konkreten Einsatz.

Gute Daten: Voraussetzung für funktionierenden E-Commerce – und sein größtes Problem

Produktdaten sind unerlässlich für fast alle Funktionen eines jeden Webshops. Sie spielen eine Rolle bei Suche und Kategorie-Listings, der Präsentation von Produkten und sind meist auch für den gesamten Checkout-Prozess von Bedeutung. Ohne ordentlich gepflegte Produktattribute kann es keine aussagekräftigen Produktvergleiche geben, Suchmaschinen-Marketing (SEO, SEA) sind deutlich weniger wirksam und Innovationen rücken in weite Ferne.  

Die Umfrage von Forrester Consulting zeigt die Probleme von B2B-Unternehmen mit der Datenverarbeitung.

Eine aktuelle Umfrage des Beratungsinstituts Forrester Consulting vom Januar 2024 zeigt jedoch, dass fast kein Unternehmen im B2B-Sektor in der Lage ist, den vollständigen Produktkatalog online verfügbar zu machen. Das Hauptproblem liegt hierbei insbesondere in einer unvollständigen oder inkorrekten Datengrundlage. Das in der Umfrage ebenfalls genannte Problem einer zu komplexen Produktstruktur, ist in der Regel für Magento-basierte Projekte kein Thema – sein flexibles Datenmodell erlaubt nahezu beliebige Konfigurationen. 

netz98 hat das Problem unbefriedigender Produktdaten ebenfalls erkannt und in den vergangenen Monaten Ansätze entwickelt, um diesem Problem begegnen zu können. Im Kern stehen hierbei unterschiedliche KI-Modelle (Künstliche Intelligenz), gepaart mit konventionellen Ansätzen wie der altbewährten OCR-Technologie zur Texterkennung. Das von uns umgesetzte Data-Framework ist für ganz unterschiedliche und beliebig komplexe Anwendungsfälle geeignet.  

Grundlegende Datenverarbeitung durch die netz98-Lösung mit KI

Am Anfang der Verarbeitungskette („Pipeline“) steht die Zusammenführung aller eingehenden Daten: das können Produktbilder, Datenblätter und Handbücher im PDF-Format oder technische Zeichnungen in beliebigen Grafikformaten sein. Diese werden durch unser flexibles System eingelesen und vorbereitet, indem z.B. der Textinhalt einer Grafik per OCR (Optical Character Recognition) ausgelesen und verarbeitbar gemacht wird.  

Die „Pipeline“ zur Datenverarbeitung durch unsere netz98-Löung. (Quelle: netz98)

Im nächsten Schritt werden die eingehenden Daten durch geeignete und jeweils individuell zusammengestellte KI-Modelle verarbeitet. Dabei sind zahlreiche Möglichkeiten vorhanden, z.B.  

  • datengetriebene Systeme zum Auslesen technischer Kennwerte 
  • große Sprachmodelle (LLM) zur zuverlässigen Erzeugung hochwertiger Texte  
  • mehrsprachige Modelle für eine hochwertige Textübersetzung 

Nach der KI-Verarbeitung müssen die erzeugten Daten unter Umständen noch nachbearbeitet werden, um z.B. die relevanten Informationen herauszufiltern oder nicht benötigte Formatierungen zu entfernen. Anschließend wird das Resultat dem Produkt zugeordnet und unterscheidet sich nicht mehr von manuell gepflegten Datensätzen. Sie stehen somit der Filterung, Suche, Anzeige etc. zur Verfügung.  

Diese Pipeline ist mit Absicht sehr abstrakt gehalten, um möglichst vielen Branchen und ihren jeweils individuellen Anwendungsfällen gerecht zu werden. Im nächsten Abschnitt zeigen wir einen ganz praktischen Anwendungsfall dieser Pipeline. 

Use Case: Umfangreiche Auswertung von Produktdatenblättern

In einem Webshop werden unterschiedliche Kleb- und Dichtstoffe angeboten, für die jeweils einige wenige Basisinformationen bereitstehen: Produktname, ein generischer Beschreibungstext, eine Abbildung sowie das Datenblatt im PDF-Format. Sucht der Kunde nun das für ihn passende Produkt, ist das mit einem hohen Rechercheaufwand verbunden: Sofern der Produktname nicht schon alle notwendigen Details verrät, muss in der Regel das Datenblatt für weitere Informationen heruntergeladen, geöffnet und mühsam gelesen werden.  Hier dürfte der Kunde schnell frustriert sein und ggf. auf einen alternativen Webshop ausweichen. 

Um diesem typischen Problem begegnen zu können, wurde durch den Shop-Betreiber entschieden, die vorhandene Datenbasis in Form der Datenblätter möglichst umfassend auszuwerten und in die Shopping-Funktion zu integrieren. So konnten mit Hilfe der von uns aufgesetzten Pipeline unter anderem folgende Produktattribute zuverlässig befüllt werden: 

  • Industrien und Branchen, für die das Produkt relevant ist 
  • Zentrale Produktmerkmale und USPs 
  • Zuordnung zu weiteren Kategorien 
  • SEO-optimierte Beschreibungstexte 
  • Typische Fragen und Antworten für Benutzer (FAQs) 

Nach der automatischen Verarbeitung durch das Data-Framework von netz98, wurde die Qualität der Customer Journey deutlich gesteigert: Der Kunde findet wesentlich schneller den gesuchten Artikel, da ihm nun eine sinnvolle Kategoriestruktur sowie eine leistungsfähige Filterung zur Verfügung stehen. Er kann auf einen Blick die wichtigsten Produktmerkmale erkennen und so schnell zum gewünschten Produkt und somit auch zum Kaufabschluss gelangen. 

Der Prozess zur Datenanreicherung dauert pro Produkt durchschnittlich ein bis zwei Minuten. Bei einer großen Artikelanzahl ist dies zwar durchaus ein Faktor, im Vergleich zum menschlichen Aufwand jedoch nicht nur deutlich schneller, sondern natürlich auch entsprechend kostengünstiger. 

Nach der automatischen Datenanreicherung erleichtern wertvolle Daten dem Kunden die Wahl des passenden Produkts. (Quelle: netz98)

Datenverarbeitung: vollautomatisch, integriert und sicher

Nach der initialen Einrichtung der Pipeline muss diese in der Regel einige Male feinjustiert werden. Anschließend werden die Verarbeitungsschritte aber vollständig automatisiert abgearbeitet. Abgesehen von einer losen Überwachung des Vorgangs fallen keine manuellen Aufwände an. Typischerweise wird die KI-Pipeline über Nacht ausgeführt, sodass störende Auswirkungen auf das Benutzer-Frontend minimiert sind.  

Bei hoch dynamischen Systemen gibt es auch Möglichkeiten, die Daten auf einem getrennten System vorzubereiten und dann auf einen Schlag auszuspielen. Der Prozess muss je Produkt nur einmal durchgeführt werden – das spart Zeit und Kosten für die Ausführung der beteiligten KI-Dienste. 

Möglicherweise bestehenden Vorbehalten zum Datenschutz und Unternehmensrichtlinien in Bezug auf Intellectual Property stellt die netz98-Lösung den Einsatz lokaler Modelle entgegen: Diese werden in geschlossenen Umgebungen ausgeführt, sodass keinerlei Daten nach außen gelangen. In jedem Fall evaluieren wir die für den jeweiligen, konkreten Anwendungsfall benötigte Infrastruktur gemeinsam, um allen Bedenken und Richtlinien Rechnung tragen zu können. 

Flexible Lösung für (fast) alle Datenprobleme

Das Problem unvollständiger, falscher oder inkonsistenter Produktdaten ist weitverbreitet und branchenunabhängig bei vielen Plattformen zu beobachten. Gleichzeitig sind Produktdaten für sämtliche Aspekte des Online-Handels unerlässlich. Je umfassender die Daten desto größer der Vorteil gegenüber dem Wettbewerb. 

War die Pflege von Produktdaten bislang überwiegend Handarbeit, so bietet die von netz98 entwickelte Lösung die Chance, diesen aufwändigen Prozess durch KI-getriebene Lösungen in weiten Teilen zu ersetzen.  Dabei ist dieser Weg deutlich schneller, günstiger und häufig auch zuverlässiger. Das von uns entwickelte Framework bietet ein solides Fundament für die Anreicherung von Produktdaten, darüber hinaus aber auch beliebige andere Entitäten: Kundendaten, Kategorien oder individuelle Datenmodelle, die Teil einer individuellen Plattform sein können. 

Bilder: iStock, netz98

 

Ihr Kontakt

Haben wir Ihr Interesse geweckt? Für eine erste Analyse mit Ausblick auf mögliche Ergebnisse sprechen Sie uns gerne an. Gemeinsam mit unseren Experten evaluieren wir vorhandene Engpässe in Ihren Daten und etwaige Brüche der Customer Journey. Dem gegenüber stellen wir mögliche Datenquellen und sinnvolle Verarbeitungsmethoden, sodass innerhalb kurzer Zeit ein belastbares Konzept entsteht. Wir stehen Ihnen gerne jederzeit zur Verfügung:

Porträt von Elias Henrich
Elias Henrich
Senior Software Architect
Magento-Potenzial nutzen – nahtlose Integration von Adobe Analytics und Adobe Target
Im Mittelpunkt steht eine PC-Tastatur mit einer Auswahl an Produkten darüber. Die Hand eines Menschen – rechts im Bild – berührt für eine Auswahl das mittlere Produktbild.

Erfahren Sie, wie Adobe Analytics und Target nahtlos in Magento integriert werden, um Personalisierung und ROI zu maximieren. Lesen Sie Read more

Interview: Umsatzwachstum im E-Commerce mit System
Goldene Wachstumskurve mit E-Commerce-Icons drumherum und Personen davor, die shoppen.

Wie lassen sich zusätzliche Wachstumspotenziale im E-Commerce mit einem durchdachten Vorgehen quantifizieren und heben? Erfahren Sie mehr im Blogbeitrag!

Identity Provider im E-Commerce: Mehr als nur Benutzerverwaltung
Ein Mensch sitzt im Vordergrund vor seinem Rechner. Um seinen Kopf kreisen Symbole. Mittig im Fokus ein Symbol für ein Türschloss. Im Hintergrund sieht man die Skyline einer Stadt mit Wolkenkratzern.

Erfahren Sie mehr über die Integration und Vorteile von Identity Providern wie Microsoft AD B2C, SAP Plattform IdP, Keycloak und Read more

Magento MVP: Schnelle Ergebnisse im E-Commerce mit geringer Investition
Großer Rechnerbildschirm mit Tastatur, der links und recht von den Schriftzügen Adobe Commerce und MVP eingerahmt ist. drumherum liegen spielerisch bzw. symbolhaft Boxen und Rädchen, mit denen man u.a. E-Commerce assoziiert

Entdecken Sie, wie ein Magento MVP-Projekt schnelle Ergebnisse im E-Commerce bei geringer Investition ermöglicht!

OData: Ein Weg zur standardisierten Datenintegration im E-Commerce
Futuristische Landschaft, im Vordergrung ein Mensch, der vor einem Laptop sitzt

Erfahren Sie, wie OData die Datenintegration im E-Commerce revolutioniert. Entdecken Sie jetzt die Vorteile und handeln Sie!

Voice Search und Conversational SEO: Erfolg im E-Commerce durch Integration in Adobe Commerce
Eine Person hält ein Smartphone waagerecht vor ihren Mund. Man sieht Schallwellen, die eine Kommunikation symbolisieren.

Voice Search und Conversational SEO prägen die Zukunft des E-Commerce. Hier liegt großes Potenzial für die Kundenbindung. Details im Blogbeitrag!

Cyber Security im E-Commerce: Mit Datensicherheit zum Erfolg!
Html- und CSS-Collage-Konzept mit Hacker

Die Bedeutung von Cyber Security wächst. Doch was bedeutet das? Wir beleuchten im Blogbeitrag die Aspekte von Sicherheit im E-Commerce.

Headless CMS: Storyblok am Beispiel von netz98-Kunde PAPSTAR
Mittiges Arrangement von Gerichten auf dem Geschirr von PAPSTAR, links oben das PAPSTAR-Logo, rechts oben das Storyblok-Logo

Im zweiten Teil unserer Blogreihe zum Thema Headless CMS lesen Sie, wieso sich unser netz98-Kunde PAPSTAR im Zuge des Shop-Relaunch Read more

Über den Autor