Automatische Klassifizierung nach eCl@ss

Das Produktklassifikationssystem eCl@ss hat sich in vielen Branchen als bevorzugter Standard etabliert. Initiiert und gefördert von den Großunternehmen der deutschen Wirtschaft, später vom Beschaffungswesen des Bundes und teilweise der Länder adaptiert, spielt eCl@ss heute vermehrt auch im Mittelstand eine tragende Rolle bei der Abwicklung des elektronischen Handels. Dabei ist die Klassifizierung von Artikelstammdaten nach eCl@ss keinesfalls trivial, denn eCl@ss ist mehr als bloß eine Warengruppenstruktur, und die Einordnung von Artikeln in Warengruppen kann bei Datenbeständen, die in die Hunderttausende oder gar in die Million gehen, schon für sich genommen, ein Unterfangen sein, das man ohne Automatisierung kaum bewerkstelligen kann. Wer aber einen Artikelstamm vollständig nach eCl@ss klassifizieren will, muss auch die sogenannten Merkmalleisten berücksichtigen. Und eigentlich muss, wer eCl@ss richtig und konsequent betreiben will, allen Artikeln auch gleich noch eine Zolltarifnummer verpassen. Doch dazu mehr in einem späteren Blogpost.

shutterstock_114089494

Klassifizieren auf der „grünen Wiese“

Natürlich gilt hier wie sonst: Jede Reise beginnt mit dem ersten Schritt. Am Anfang einer eCl@ss-Einführung sollte man sich zunächst um die Warengruppenzuordnung kümmern. Falls vorher schon ein anderes Warengruppensystem (z.B. ein unternehmenseigenes) verwendet wurde, so kann das bei der eCl@ss-Einführung durchaus hilfreich sein. Aber leider kann diese Situation auch dazu verleiten, das Falsche zu tun, dann nämlich, wenn versucht wird, die eCl@ss-Kategorie aus der vorhandenen Warengruppe zu „mappen“. Dieser Ansatz erscheint zunächst naheliegend und sinnvoll, weil man ja die vorhandenen Informationen weiter nutzen kann. Im weiteren Verlauf beschäftigen sich dann oft ganze Fachabteilungen damit, Zuordnungstabellen zu erstellen, die die Warengruppen aufeinander abbilden sollen. Am Ende stellt sich dann typischerweise heraus, dass so ein Mapping kaum oder gar nicht definiert werden kann, es sein denn, die Granularität der beiden Warengruppensysteme wäre zufällig bis ins Detail identisch.

Ein Beispiel

Nehmen wir mal an, der Materialstamm eines Unternehmens wäre nach einem unternehmensinternen Warengruppensystem klassifiziert, und dieses System würde z.B. bei Strömungspumpen zwischen Axial-, Diagonal- und Radialpumpen unterscheiden. Das wäre eine Einteilung der Warengruppen, die in der Praxis durchaus so vorkommen könnte.

In eCl@ss hingegen findet man ganz andere Kategorien:

  • Tauchmotorpumpe
  • Umlaufbeschleunigerpumpe
  • Hebewerk (Druckerhöhung)
  • Kreiselpumpe mit Wellendichtung
  • Kreiselpumpe mit Spaltrohrmotor
  • Kreiselpumpe mit Magnetkupplung
  • Sonstige, nicht weiter spezifizierte Kreiselpumpe

Man sieht auch als Laie, dass es keine Entsprechungen zwischen den beiden Systemen gibt. Die Warengruppe wird in eCl@ss maßgeblich durch das Dichtsystem (Wellendichtung, Magnetkupplung, …) der Kreiselpumpe bestimmt, während die Bauform (axial, diagonal oder radial) lediglich als Sachmerkmal unterschieden wird. In unserem angenommenen Beispiel ist hingegen die Bauform für die Warengruppe entscheidend. Egal wie man sich nun wendet oder dreht: Die eCl@ss-Kategorie kann gar nicht hergeleitet werden, jedenfalls nicht, solange man ausschließlich die unternehmensinterne Warengruppe betrachtet. In der Praxis kommt es leider vor, dass nun „ganz pragmatisch“ jeder Pumpe eine Wellendichtung unterstellt wird, oder sogar gleich alle Pumpen unter „Sonstige“ subsumiert werden. Dass so eine „Lösung“ in Wirklichkeit nicht pragmatisch, sondern eigentlich Murks ist, versteht sich von selbst.

Vorhandene Informationen nutzen

Dabei ist die Lösung des Problems relativ einfach. Man darf eben nicht nur die unternehmensinterne Warengruppe betrachten, sondern muss darüber hinaus alle Informationen, die sonst noch über den Artikel zur Verfügung stehen, auswerten. Wenn z.B. in der Artikelbezeichnung das Wort „magnetgekuppelt“ vorkommt, dann liegt es auf der Hand, dass man diese Information nutzen sollte, statt sie zu ignorieren. Um das in der Praxis effektiv umsetzen zu können, benötigt man eine Software, die die vorhandenen Stammdaten mittels maschineller Lernalgorithmen für eine automatische Klassifizierung verwerten kann. Grob gesagt wird dabei anhand bekannter Beispiele (Lernmenge) berechnet, wie sich das Vorkommen des Wortes „magnetgekuppelt“ in der Artikelbezeichnung auf die (bedingte) Wahrscheinlichkeit auswirkt, dass es sich bei dem betreffenden Artikel um eine „Kreiselpumpe mit Magnetkupplung“ handelt. Der so berechnete Wahrscheinlichkeitswert wird dann zur Vorhersage der noch unklassifizierten Artikel verwendet. Tatsächlich funktionieren Verfahren zur automatischen Klassifizierung selbst dann recht gut, wenn vor der Einführung von eCl@ss noch gar keine interne Warengruppe in Verwendung war.

Im nächsten Blogpost wird es darum gehen, wie man Methoden zur automatischen Klassifizierung im Stammdaten-Qualitätsmanagement einsetzen kann.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.