Manuel Storz

 
 

Personalisierung


Content Management Seminar


 
 
 
 

What is Personalization?


Personalization is the combined use of technology and customer information to tailor electronic commerce interactions between a business and each individual customer. Using information either previously obtained or provided in real-time about the customer and other customers, the exchange between the parties is altered to fit that customer's stated needs so that the transaction requires less time and delivers a product best suited to that customer.

(Quelle: Personalization Consortium, www.personalization.org)

 
 
 

Allgemeines

Personalisierung ist das inhaltliche Zuschneiden von Websites auf individuelle Benutzer. Dies geschieht unter Zuhilfenahme von zuvor gesammelten und in Echtzeit gewonnenen Daten über diese User, die in einer Datenbank gespeichert werden und als Referenz für die Auswahl des Contents dienen. Mit Content sind alle Daten gemeint, die Inhalte vermitteln - Texte, Bilder und Graphiken, also Information, die über die Website dem Benutzer angeboten wird. Der Vorgang ist weitestgehend automatisiert, d.h. das personalisierte System lernt selbstständig aus dem Verhalten des Benutzers und erstellt daraus ein Profil, ohne daß der Benutzer selbst viele Eingaben zu seiner Person, seinen Interessen oder ähnlichem tätigen muß. Sobald ein Benutzer die Website betritt, wird er automatisch erkannt und die Angebote und Informationen seinen Interessen und Konsumwünschen angepasst, d.h. der Inhalt der Site erscheint durch einen Filter, oder Schwerpunkte werden gesetzt. Je mehr Benutzerdaten vorhanden sind, desto spezifischer präsentiert sich die Website; bei jedem erneuten In-Erscheinung-Treten des Benutzers wird der Datenbestand angereichert - ein Kreislauf wird in Gang gesetzt. Aus technischer Sicht setzt dies die dynamische Implementierung der Website voraus; die notwendige Anbindung an die Benutzerdatenbank und die Verknüpfung mit der Produkt- und Informationsdatenbank über eine sogenannte Content-Engine lassen ahnen, daß die Personalisierung einer Website mit relativ hohem Aufwand verbunden und somit recht kostenintensiv ist. Personalisierung ist ein marketingorientierter Prozeß - Unternehmen, die e-commerce betreiben, erhoffen sich davon eine bessere Kundenbindung und damit höhere Absätze. Daß sich allerdings auch noch eine Vielzahl anderer neuer Möglichkeiten auftut, ist leicht ersichtlich und bereitet nicht nur Datenschützern manches Kopfzerbrechen; so können Unternehmen Benutzerdaten untereinander austauschen oder sich gegenseitig verfügbar machen (was durchaus schon geschieht - das wohl beste Beispiel ist der Online-Advertiser DoubleClick.net). Ebenso machen die Benutzerdatenbanken Verhaltensmuster ganzer Kundenstämme verfügbar, und die Granulierung statistischer Daten auf Individuen ist ebenfalls möglich.
 
 

Die drei Stufen der Personalisierung

Man kann drei Stufen von Personalisierung unterscheiden:
Anonyme Personalisierung, individuelle Personalisierung und Individualisierung (oder Customization). Der Unterschied zwischen den beiden ersten besteht im Wesentlichen darin, daß ein anonym personalisiertes System den gesammelten Benutzerdaten noch keine Identität zuordnen kann, während dies beim individuell personalisierten System der Fall ist; der Begriff "anonyme Personalisierung" ist daher etwas irreführend.
 

Anonyme Personalisierung

Innerhalb der anonymen Personalisierung kann man drei verschiedene Arten von benutzerbezogenen Basisdaten unterscheiden: die anonymen Benutzerdaten, also Verhaltensmuster und Profile über individuelle Benutzer, die das System selbstständig gesammelt hat; die sogenannten clickstream data - das sind Daten über das Surfverhalten der Benutzer, zum Beispiel wann die Website betreten wurde, wie lange wer wo verweilt (innerhalb der Site), welchen Weg der User durch die Site nimmt und, unter Umständen, von wo aus er auf die Site kam - diese Art der Datenerfassung wird meist als tracking bezeichnet; ihr liegen verschiedene Technologien wie Cookies, Web Beacons und die Auswertung der Server-log files zugrunde, die später genauer erläutert werden, und die Massendaten, statistische Daten über Usergruppen; hierzu gehören mikrogeographische Daten und soziodemographische Daten wie Einkommens-, Berufs- und Altersgruppen, die in vielen Fällen über Online-Surveys und e-mail-Kampagnen gewonnen werden; sie werden zur Ergänzung der Benutzerdatensätze, für die Ableitung psychologischer Profile für die Prioritätensetzung bei den Userdaten und für die Anpassung der (nicht personalisierten) Startseite für Neubenutzer verwendet.
 

Individuelle Personalisierung

Meist geht ein anonymes System früher oder später in ein individuelles über, nämlich spätestens bei der Abwicklung eines ersten Geschäftsvorgangs. Dann wird der Benutzer ja seine Personendaten übermitteln, um die Transaktion (Zulieferung des Produkts/Abwicklung einer Dienstleistung - Bezahlung) zu ermöglichen. Die Zuordnung einer Benutzeridentität kann aber auch schon zu einem früheren Zeitpunkt erfolgen, beispielsweise durch die Subskription für Newsletter oder ähnliches - das System erhält auf diesem Wege Namen und e-Mail-Adressen. Sobald also ein anonym personalisiertes System die Identität seines Benutzers kennt und nicht mehr nurmehr der Rechner, von dem aus die Website aufgerufen wird, anhand der Cookie-ID erkannt wird, spricht man von individueller Personalisierung. Damit tut sich eine Reihe weiterer Möglichkeiten auf; die wohl mit am höchsten gewichtete ist die sogenannte Kaufhistorie des Benutzers. Da man allgemein davon ausgeht, daß der Kauf eines Produkts ein sehr starkes Signal für Interesse von Seiten des Benutzers/Kunden ist, erhält die Kaufhistorie, also die Aufzeichnung aller Käufe, die bisher getätigt wurden, innerhalb des Benutzerdatensatzes hohe Priorität. Amazon, einer der Pioniere in Sachen Web-Personalisierung, macht von der Kaufhistorie sehr stark Gebrauch - wie viele wissen, kann sich das durchaus auch negativ bemerkbar machen. Einfachstes Beispiel: man kauft - ich will beim Beispiel Amazon bleiben - ja nicht nur Bücher, Videos und CD's für sich selbst, sondern gerade auch als Geschenk. Man würde aber sicher nicht alles, was man verschenkt, auch für sich selbst kaufen - die Folge liegt auf der Hand: das personalisierte System stuft unter Umständen meine Interessen nicht mehr korrekt ein, die Benutzerdaten werden "verfälscht". Solche Fehleinschätzungen haben manchmal sehr erheiternde, aber auch nervtötende Folgen für den Benutzer. Über die Erstellung einer Kaufhistorie hinaus macht ein personalisiertes System Bonus- und Rabattsysteme möglich, beispielsweise das "Punkte sammeln"; auch gezieltere Werbung mit Hilfe von ad-Bannern und Werbe-e-Mails wird wesentlich erleichtert. In Kombination stehen somit eine Reihe von Mitteln zur Verfügung, die - richtig eingesetzt - sehr wirkungsvolles Online-Marketing ermöglichen.
 

Individualisierung oder Customization

Der Hauptunterschied zwischen Individualisierung oder Customization und den beschriebenen Stufen der anonymen und der individuellen Personalisierung liegt darin, daß es sich bei der Individualisierung um Personalisierung mit der ausdrücklichen Einwilligung und unter der aktiven Mitgestaltung des Benutzers handelt; dies bedeutet, daß jeder Benutzer selbst auf der betreffenden Website seine Interessensgebiete auswählt und die Vorgaben, unter denen ihm Inhalte und Angebote vermittelt werden, mit beeinflußt. Er ist sich der Tatsache bewußt, daß er durch die Benutzung einer solcherart personalisierten Website der Anlage eines Datenbestandes (Erstellung eines persönlichen Profils, Interessen, Konsumwünsche etc.) zustimmt. Individualisierte Systeme funktionieren fast immer über einen Account, d.h. der Benutzer loggt sich über Username und Passwort auf "seine" Site ein.
Dies führt uns auf den Begriff des Portals. Das Portal ist die technisch ausgefeilteste Variante eines individualisierten Systems, das bei vergleichsweise größtem Implementierungsaufwand und hohen Ansprüchen an die zugrundeliegende Technik dem Benutzer die besten Möglichkeiten und den höchsten Komfort bietet. Im Wesentlichen sind es die folgenden Eigenschaften und Funktionalitäten, die ein individuell personalisiertes System zum Portal (im strengeren Sinne - der Begriff des Portals wird in unterschiedlicher Weise verwendet und ist deshalb etwas unpräzise) erweitern: Multichannel Interface - ein Portal soll nicht nur über Internet benutzt werden können, sondern nach Möglichkeit auch über WAP-fähige Handys, Personal Digital Assistants (PDA's) und - vielleicht in naher Zukunft - über Interactive TV (I-TV); konfigurierbares Interface - Portale verfügen über individuell einstellbare (graphische) Benutzeroberflächen, d.h. jeder Benutzer kann das Erscheinungsbild des Portals nach seinem Geschmack verändern; Einflußnahme des Benutzers auf die Userdatensätze zu seiner Person - wie bereits erwähnt, soll es ein Portal seinem Benutzer ermöglichen, die vom System erstellten Profile zu ergänzen und zu bearbeiten. Des weiteren können Portale Anwenderforen, Alerting- und Benachrichtigungsfunktionen und Spracherkennung für die Kommunikation mit dem Portal über Telefon bieten - solche Systeme sind teilweise schon implementiert. Natürlich muß ein individualisiertes System nicht alle diese Funktionalitäten aufweisen, um sich Portal nennen zu können, und teilweise handelt es sich - wie bei der erwähnten Einbindung von interaktivem Fersehen - auch noch um Zukunftsmusik, aber die Entwicklung schreitet rasch voran.
 
 

Essentielle Technologien der Personalisierung

Die Erfassung von Benutzerdaten

Beim Herausfiltern von Daten über das Verhalten von Benutzern spielt das bereits erwähnte tracking eine wesentliche Rolle. Das tracking dient der Erfassung der sogenannten clickstream data: wieviele User halten sich im Moment auf der Website auf? Wann kam welcher User auf die Site, wo war er zuvor? Wie navigieren die Benutzer durch die verschiedenen Subsites, welche Wege werden gewählt? Wo wird die Site wieder verlassen? Wo hält sich wer am längsten auf? Um diese Daten gewinnen zu können, sind verschiedene Technologien notwendig; wir betrachten Cookies, die log-file-evaluation und Web Beacons.
Beim erstmaligen Besuch einer Website wird dem Browser des Benutzers eine ein-eindeutige ID-Nummer zugewiesen, die in einer "Mini-Datei", Cookie genannt, auf dem User-System gespeichert wird. Wird später die Site wiederbetreten, liest ein Prgramm auf dem Host-Server die ID aus dem Cookie aus und erkennt damit den User wieder. Das Cookie-Protokoll wurde von Netscape entwickelt; Cookies ermöglichen personalisierten Systemen die einfachste und schnellste Entwicklung ihres Datenbestandes, haben aber aus der Sicht des Anwenders einer personalisierten Website allerdings einen gravierenden Nachteil: sie sind abschaltbar, d.h. der Benutzer hat immer die Möglichkeit, über seinen Browser das Ablegen eines Cookies auf seinem System zu unterbinden.
Bei der log-file-evaluation geht es um die Auswertung der Serverdaten. Auf jedem Server, der Webseiten zur Verfügung stellt, fallen große Mengen an "Betriebsdaten" an, da alle Vorgänge auf dem Server protokolliert werden. Diese Daten geben Aufschluß über große Teile der unter clickstream data zusammengefaßten benutzerrelevanten Daten und werden deshalb ausgewertet. Da dies aber mit hohem Rechenaufwand verbunden ist, gibt es schon seit längerem sogenannte Traffic Analysis Provider, auf die Auswertung von log-files spezialisierte Dienstleister wie zum Beispiel SurfAid Analytics von IBM, HitBox Enterprise oder WebTrends Live, die für ihre Firmenkunden die Evaluation der Serverdaten übernehmen. Sie erstellen aus den Rohdaten statistische Werte, die dann in Tabellen präsentiert werden. Datenbankgestützte Verfahren ermöglichen das sogenannte data spinning; Daten werden räumlich dargestellt und können aus beliebigen "Perspektiven" betrachtet werden.
Web Beacons sind kleine "Leuchttürme" aus Code, die auf mehreren oder allen Subsites einer Website verteilt sind und Daten an den Server senden. Sie messen Benutzeraktivität (clickstream data), die zusätzlich zu den log-file-Daten Informationen wie Benutzerwege und das Festhalten der einzelnen Benutzer über multiple Zonen der Site hinweg ermöglichen.
 

Basistechnologien für die Implementierung eines personalisierten Systems

Im folgenden sollen noch die wichtigsten und wohl auch verbreitetsten Implementierungsgrundlagen, die momentan für den Aufbau von personalisierten Systemen Verwendung finden, erwähnt werden.
Es sind dies programmiersprachliche Konstrukte wie Enterprise Java Beans (EJB), Java Server Pages (JSP) und Java 2 Enterprise Edition (J2EE), die plattformunabhängiges Arbeiten und Erweiterungen in nahezu beliebigem Ausmaß ermöglichen; als Datenbanken kommen vor allem Systeme wie Oracle und DB2 in Frage. Content Management Systeme greifen häufig auf XML (Extensible Markup Language) zurück.
Beim Aufbau von Multichannel Interfaces für Portale spielen unter anderem auch noch weitere Markup Languages wie WML (Wireless Markup Language) und HDML (Handheld Device Markup Language) eine Rolle; außerdem finden verschiedene Protokolle wie WAP (Wireless Application Protocol) Verwendung. Die zukünftige Entwicklung wird allerdings, was diese im Moment noch etwas wild nebeneinander existierenden Quasi-Standards betrifft, wohl auf eine Vereinheitlichung und damit auf die Reduzierung dieser Vielzahl auf einen Standard hinauslaufen.