In diesem Kapitel wird die technische Implementierung erläutert. Im ersten Unterkapitel werden die Anforderungen an den Prototypen erläutert und anschließend eine Techno-logie selektiert, die für die Umsetzung der Anforderungen geeignet ist. Im zweiten Un-terkapitel werden die technischen Grundlagen erläutert, die für das Verständnis der Im-plementierung der automatisierten Konkurrenzpreisbeschaffung (Kapitel 4.4) und der automatisierten Preissetzung (Kapitel 4.5) benötigt werden. Im dritten Unterkapitel wird die Selektion einer Datenbank und Plattform für den Prototypen diskutiert.

Selektion einer Technologie

Im ersten Unterkapitel werden Anforderungen an den Prototypen erläutert. Es werden die wichtigsten Ergebnisse des theoretischen Teils zusammengefasst und es wird disku-tiert, welche Daten für die Umsetzung der selektierten Strategie beschafft werden müs-sen. Zudem werden die technischen Anforderungen an den Prototypen diskutiert. Im zweiten Unterkapitel wird eine Technologie vorgestellt, mit der die Anforderungen um-gesetzt werden können.

Anforderungen

Die zweite Zielsetzung dieser Arbeit ist die Beantwortung der Frage, wie der Prozess automatisiert werden kann, die dynamischen Preise der Wettbewerber in Echtzeit zu beschaffen und in einer Datenbank zu speichern (Kapitel 4.4), sodass es möglich wird, die eigenen Preise in Abhängigkeit von diesen Preisdaten dynamisch zu gestalten. Im dritten Kapitel wurde herausgearbeitet, dass für Lebensmitteleinzelhändler bestimmte Eckartikel existieren. Für diese Eckartikel ist, im Gegensatz zu den Abschöpfungsarti-keln, die Preissetzung in Abhängigkeit von Konkurrenzpreisen zu gestalten. Für die Wa-rengruppe „Obst und Gemüse“ sowie für die Markenartikel der Warengruppen „Grund-nahrungsmittel“ und „Molkereiprodukte“ des Normalsortiments sollen die Konkurrenz-preise (Normalpreise) dynamisch unterboten werden. Für die Warengruppe „Frische-Theken“ und die Markenartikel der Warengruppe „Alkoholfreie Getränke“ des Normal-sortiments sollten die Konkurrenzpreise gehalten werden, und für einige selektierte Pro-dukte eine Unterbietung der Wettbewerbspreise (Normalpreise) erfolgen. Im Folgenden werden die Daten vorgestellt, die durch den Prototyp automatisiert beschafft werden müssen.

Die benötigten Konkurrenzdaten für das Dauerniedrigpreisprogramm umfassen pro Eck-artikel den Artikelnamen, den Normalpreis des Artikels, das Datum der Information (da sich der Normalpreis des Wettbewerbers ändern kann) sowie den Wettbewerber, für dendiese Preisinformationen gelten. Des Weiteren wird die Größeneinheit des Artikels be-nötigt, da verschiedene Größen eines Markenartikels existieren können, und der Artikel entsprechend zugeordnet werden muss.

Wie bereits erwähnt, sollen ebenfalls die Wettbewerbsdaten beschafft werden, die für die Preissetzung von Sonderangeboten relevant sind. Die benötigten Konkurrenzdaten für Sonderangebote umfassen pro Sonderangebot den Artikelnamen, den Sonderange-botspreis und die Preisreduktion im Vergleich zum Normalpreis, das Start- und Endda-tum des Sonderangebots sowie die Größeneinheit des Artikels und den entsprechenden Wettbewerber.

Der implementierte Prototyp soll als Framework für die Konkurrenzpreisbeschaffung al-ler Wettbewerber genutzt werden können. Um zu zeigen, dass diese Idee der automa-tisierten Konkurrenzpreisbeschaffung technisch funktioniert, sollen im Rahmen des Pro-totyps die Daten eines exemplarischen Wettbewerbers beschafft werden. Der Prototyp soll über eine zweckmäßige Strukturierung und wiederverwendbare Funktionen verfü-gen, sodass eine Erweiterung um die Datenbeschaffung von weiteren Konkurrenten komfortabel und einfach möglich ist. Weil der erweiterte Prototyp viele Wettbewerber umfassen soll, muss die für den Prototyp verwendete Plattform eine hohe Performanz aufweisen. Zudem muss die genutzte Plattform über eine geeignete Threading-Archi-tektur verfügen, um die parallelen Web-Scraping-Prozesse performant bearbeiten zu können.

Web-Scraping als Technologie

Bezüglich der Automatisierung der Konkurrenzpreisbeschaffung musste zuerst überlegt werden, inwiefern und aus welcher Quelle die dynamischen und aktuellen Konkurrenz-preise beschafft werden können. Die Preisdaten müssen zudem in einer Art vorliegen, die einen Zugang durch ein technisches Werkzeug erlaubt. Eine Informationsquelle, die die genannten Kriterien erfüllt, sind die Webseiten der Wettbewerber. Die Wettbewerber preisen auf ihren Webseiten aktuelle Sonderangebote und Preisaktionen an, mit denen sie die Kunden in ihr Geschäft locken möchten. Im Kontext der Sonderangebote wird zudem häufig der Normalpreis der Artikel angegeben, um die Vorteilhaftigkeit darzu-stellen. Die Normal- und Sonderangebotspreise der beworbenen Artikel sind somit öf-fentlich zugänglich und können genutzt werden. Durch die Preisbeschaffung von den Wettbewerbern selbst, und nicht von Drittquellen, wird zudem sichergestellt, dass die Preisdaten korrekt und aktuell sind.

Ein Nachteil dieser Vorgehensweise ist, dass die Preise von Artikeln, die nicht beworben werden, nicht beschafft werden können. Geht man allerdings davon aus, dass die Wett-bewerber insbesondere Eckartikel durch Sonderangebote profilieren, erscheint die Me-thode geeignet, da, wie bereits erwähnt, die Eckartikelpreise in Abhängigkeit von den Konkurrenzpreisen gesetzt werden müssen. Zudem kann bei der Beschaffung von Preisinformationen über einen langen Zeitraum trotzdem ein zweckmäßiger Gesamtfun-dus an Preisdaten zu vielen Produkten entstehen. Des Weiteren kann der Nachteil dadurch kompensiert werden, dass eine hohe Anzahl von verschiedenen Wettbewerbern aufgenommen wird.

Webseiten werden durch die sogenannte HyperText-Markup-Language (Kapitel 4.2.1) definiert (Munzert et al. 2015, S. 17). Die Strukturierung von Webseiten mit HTML trägt insbesondere der Aufgabe Rechnung, den Inhalt der Webseite den Menschen, die das HTML-Dokument mit einem Browser aufrufen, auf angemessene Weise zu präsentieren (Vargiu und Urru 2013, S. 44). HTML-Webseiten sind somit nicht für die automatisierte Informationsaufnahme durch Maschinen optimiert. Um die technischen Herausforderun-gen zu lösen, die mit der Extraktion von Daten aus HTML-Webseiten verbunden sind, kann die sogenannte Web-Scraping-Technologie verwendet werden (Vargui und Urru 2013, S. 44). Unter Web-Scraping wird eine Menge von Techniken verstanden, die es ermöglicht, den Prozess der Informationsextraktion von Webseiten zu automatisieren, sodass die Informationen nicht mehr manuell kopiert werden müssen (Vargiu und Urru 2013, S. 44). Eine weitere Kernaufgabe von Web-Scrapern ist es, die extrahierten Daten so zu transformieren bzw. zu bereinigen, dass sie in einer Datenbank gespeichert werden können (Vargiu und Urru 2013, S. 44). Die genannte Definition von Web-Scraping hat somit einen inhaltlichen Charakter, und ist losgelöst von einer genauen technischen Vorgehensweise bzw. einem genutzten Framework. Im folgenden Kapitel werden die technischen Grundlagen erläutert, die für das Verständnis des Web-Scrapings benötigt werden.