-
Die
Erfindung betrifft ein Netzwerk gemäß dem Oberbegriff des Anspruchs
1.
-
Ein
derartiges Rechnernetzwerk kann insbesondere vom Internet gebildet
sein. Weiterhin kann das Netzwerk von einem Intranet, das heißt einem
internen Netzwerk gebildet sein, das beispielsweise in größeren Firmen
oder Behörden
zum Einsatz kommen kann.
-
In
derartigen Netzwerken kann ein Benutzer über einen Kundenrechner durch
Eingabe einer Folge von Anfragen Informationen abrufen. Weiterhin kann
der Benutzer auf diesem Weg auch elektronische Bestellvorgänge tätigen, das
heißt
durch eine Folge von Anfragen informiert sich der Benutzer über das
Kaufangebot eines Kaufhauses oder dergleichen und entscheidet sich
derart für
den Kauf bestimmter Produkte.
-
Dabei
ist es generell wünschenswert,
das Benutzerverhalten bei der Durchführung von Anfragen im Netzwerk
zu analysieren. Für
das genannte Beispiel eines Kaufhauses ist eine Analyse des Benutzerverhaltens
deshalb von hohem Interesse, da hieraus wertvolle Informationen über das
Kaufverhalten der Benutzer gewonnen werden können. Weiterhin können durch
eine Analyse des Benutzerverhaltens beispielsweise Informationen
darüber
gewonnen werden, ob das Spektrum der Waren, das ein Kaufhaus anbietet,
den Bedarf der Kunden erfüllt oder
nicht.
-
Problematisch
bei derartigen Analysen ist generell, dass durch die große Anzahl
einzelner Anfragen im Netzwerk einerseits, und durch die Verzweigung des
Netzwerks andererseits, wie es beispielsweise beim Internet der
Fall ist, eine enorme Menge an auszuwertenden Daten anfällt. Die
Ableitung von geeigneten Kenngrößen, die
das Benutzerverhalten in geeigneter Weise analysieren, ist daher äußerst schwierig
und zeitaufwendig.
-
Der
Erfindung liegt die Aufgabe zugrunde für ein Netzwerk der eingangs
genannten Art Mittel bereit zu stellen, mittels derer eine exakte
Analyse des Benutzerverhaltens von Benutzern dieses Netzwerks ermöglicht wird.
-
Zur
Lösung
dieser Aufgabe sind die Merkmale des Anspruchs 1 vorgesehen. Vorteilhafte
Ausführungsformen
und zweckmäßige Weiterbildungen
der Erfindung sind in den Unteransprüchen beschrieben.
-
Das
erfindungsgemäße Netzwerk
umfasst eine Anzahl von Kundenrechnern und auf Serverrechnern installierten
Servern. Auf eine von einem Kundenrechner an einen Server gerichtete
Anfrage ist von diesem eine Antwort an den Kundenrechner ausgebbar.
Die Inhalte einer Folge von Anfragen und Antworten sind in einem
Logfile abgespeichert, die einzelnen Anfragen und Antworten sind
jeweils mit einem Zeitstempel und einer Session-ID abgespeichert.
Der Logfile enthält
die Inhalte der Anfragen und Antworten kennzeichnende Kriterien.
In einer Analyseeinheit erfolgt eine Sortierung des Logfiles nach durch
die Session-ID gekennzeichneten Sessions erfolgt, worauf durch Bildung
von Mengenbedingungen für
Kriterien einzelner Sessions Areas bildende Zahlenfolgen zur Bildung
von Kenngrößen für das Benutzerverhalten
des Benutzers der jeweiligen Kundenrechner generiert werden.
-
Anhand
der erfindungsgemäßen Auswertung
der im Logfile enthaltenen Informationen kann das Benutzerverhalten
von Benutzern des Netzwerks exakt analysiert werden. Dabei wird
der Logfile in einer geeigneten Einheit abgespeichert, so dass die Auswertung
zeitlich entkoppelt vom zeitlichen Ablauf der Anfragen und Antworten
erfolgen kann.
-
Ein
wesentlicher Vorteil der Erfindung besteht darin, dass durch die
strukturierte Auswertung auch große Datenmengen in Logfiles
einfach und schnell ausgewertet werden können, wobei durch diese Auswertung
Kenngrößen abgeleitet
werden, die das Benutzerverhalten genau analysieren.
-
Ein
wesentlicher Aspekt bei der erfindungsgemäßen Analyse des Benutzerverhaltens
besteht darin, dass die im Logfile enthaltenen Informationen zunächst nach
Session sortiert werden. Die so vorsortierten Daten ermöglichen
einen erheblich vereinfachten Zugang zur Ableitung von relevanten
Kenngrößen für das Benutzerverhalten
von Benutzern.
-
Die
Sortierung der Informationen des Logfiles erfolgt in der Analyseeinheit
anhand der Session-ID, die für
die einzelnen Anfragen und Antworten im Logfile hinterlegt sind.
-
Für den Fall,
dass das Netzwerk vom Internet gebildet ist und entsprechend die
Server von Webservern gebildet sind, vergeben die einzelnen Webserver
die Session-ID, die Folgen von Anfragen von einem Benutzer kennzeichnen.
-
Der
Begriff Session-ID ist für
die vorliegende Erfindung hierauf nicht beschränkt. Vielmehr ist mit dem Begriff
Session-ID jede Art einer vorzugsweise eindeutigen Kennzeichnung
von Folgen von Aktionen einer vorgegebenen Quelle als allgemeiner
Definition einer Session umfasst.
-
Ein
wesentliches Element der Erfindung für die Ableitung von dem Benutzerverhalten
von Benutzern des Netzwerks charakterisierenden Kenngrößen besteht
darin, dass der Logfile derart ausgebildet ist, dass dieser die
Inhalte von Anfragen und Antworten kennzeichnende Kriterien enthält.
-
Bei
derartigen Kriterien handelt es sich allgemein um Kategorien, welche
vorgegebenen Informationen im Logfile zugeordnet werden können.
-
Der
Begriff des Kriteriums wird im Folgenden beispielhaft für den Fall
erläutert,
dass als Bestandteil des Netzwerks im Datenbestand eines Kaufhauses bestimmte
Waren recherchiert und auf elektronischem Weg bestellt werden können.
-
Interessiert
sich beispielsweise ein Benutzer für den Preis eines gestreiften
Anzugs und richtet er über
seinen Kundenrechner eine entsprechende Anfrage an den entsprechenden
Server, worauf der Benutzer die gewünschte Preisinformation enthält, so wird
die entsprechende Anfrage in den Logfile übernommen.
-
Je
nach Struktur der jeweiligen Anfragen und Antworten kann neben dem
Suchbegriff „gestreifter Anzug" als Oberbegriff „Herrenmode" als Zusatzinformation
im Logfile stehen. In der Analyseeinheit kann dieser Oberbegriff „Herrenmode" als Kriterium übernommen
werden.
-
Alternativ
können
in den Analyseeinheiten auch derartige Kriterien selbsttätig berechnet
oder ermittelt werden und dann nachträglich in den Logfile eingetragen
werden.
-
Generell
wird der Logfile von der Analyseeinheit so aufbereitet, dass dieser
eine geeignete Anzahl von Kriterien enthält, mittels derer die Informationen
im Logfile strukturiert werden.
-
Die
Kenngrößen für das Benutzerverhalten von
Benutzern werden erfindungsgemäß durch
Bildung von Areas gewonnen. Derartige Areas bilden Zahlenfolgen,
die durch Bildung von Mengenbedingungen für Kriterien einzelner Sessions
gewonnen werden. Im einfachsten Fall ist eine Area von den Anzahlen
von Sessions gebildet, die ein oder mehrere Kriterien erfüllt. Derartige
Areas bilden kompakte Kenngrößen, die
bereits für
sich allein eine präzise Einordnung
von unterschiedlichen Benutzern erlauben.
-
In
einer bevorzugten Weiterbildung kann eine solche Area auch die Zeitdauer
einer jeweiligen Session enthalten. Dies erfolgt durch die Auswertung von
den im Logfile enthaltenen Zeitstempeln der einzelnen Anfragen und
Antworten. Durch die Auswertung derartiger Zeitinformationen werden
noch detailliertere Bewertungen des Benutzerverhaltens möglich, beispielsweise
derart, welche der Anfragen am häufigsten
und am längsten
von den Benutzern durchgeführt
werden.
-
Da
der Logfile sehr große
Datenmengen enthält,
wird dieser gemäß einer
besonders vorteilhaften Ausführungsform
dadurch noch weiter strukturiert, dass aus diesem unterschiedliche
Populationen abgeleitet werden. Dabei wird aus dem Logfile eine
Population dadurch gebildet, dass bei der Population wenigstens
ein Kriterium erfüllt
sein muss. Durch Heranziehen mehrer unterschiedlicher Kriterien
können mehrere
Populationen gebildet werden, die unabhängig voneinander und parallel
ausgewertet werden können,
indem für
diese geeignete Areas gebildet werden.
-
Dadurch
ist eine schnelle und strukturierte Auswertung der Informationen
im Logfile möglich.
-
Zusätzlich zur
Bildung von Areas, die eine mehr abstrakte Kennzeichnung des Benutzerverhaltens
liefern, können
gemäß einer
vorteilhaften Ausführungsform
der Erfindung auf der Basis der Area-Auswertung auch Listen generiert
werden, die konkrete Werte, das heißt Inhalte der einzelnen Anfragen
und Abfragen enthalten, wobei diese durch die Area-Auswertung bestimmten
Sessions zugeordnet sind.
-
Ein
wesentlicher Vorteil der Erfindung besteht darin, dass die vorgenannten
Auswertungen auch zeitabhängig
vorgenommen werden können,
so dass dadurch das Benutzerverhalten zeitabhängig analysiert werden kann.
-
Die
Erfindung wird im Nachstehenden anhand der Zeichnungen erläutert. Es
zeigen:
-
1:
Ausführungsbeispiel
des erfindungsgemäßen Netzwerks.
-
2:
Erstes Beispiel eines Logfiles.
-
3:
Strukturierung des Logfiles gemäß 1 nach
Sessions.
-
4:
Zeitablauf der Sessions des Logfiles gemäß 1.
-
5:
Zeitabhängige
Area-Auswertung für die
Sessions gemäß 4.
-
6:
Zeitdiagramm für
die Auswertung gemäß 5.
-
7:
Zweites Beispiel eines Logfiles.
-
8:
Bildung einer ersten Population mit anschließender Area-Auswertung für den Logfile gemäß 7.
-
9:
Bildung einer zweiten Population mit anschließender Area-Auswertung für den Logfile gemäß 7.
-
10:
Vektordiagramm für
die Area-Auswertungen gemäß den 8 und 9.
-
11:
Bildung einer Liste auf der Basis der Area-Auswertung gemäß 8.
-
1 zeigt
schematisch ein Ausführungsbeispiel
des erfindungsgemäßen Netzwerks 1.
Das vorliegende Beispiel bezieht sich auf das Internet als Netzwerk 1,
wobei über
Kundenrechner 2 Benutzer Zugang zum Netzwerk 1 erhalten.
Der Übersichtlichkeit
halber ist in 1 nur ein Kundenrechner 2 darge stellt.
In 1 sind dabei die Softwarekomponenten des Kundenrechners 2,
das heißt
des sogenannten Clients, dargestellt, mittels derer der Benutzer
Zugang zum Internet erlangt. Der Kundenrechner 2 kann von
einem Personal-Computer
gebildet sein. Als Softwarekomponente des Kundenrechners 2 ist insbesondere
ein Web-Browser vorgesehen, mittels dessen in bekannter Weise ein
Zugang zum Internet hergestellt werden kann. Der Benutzer erhält Zugang zu
einer Webseite, die in 1 mit W bezeichnet ist.
-
Über die
Webseite können
unterschiedliche Informationen erhalten werden. Hierzu werden vom Benutzer
durchzuführenden
Anfragen 3 auf einen Http-Server, im Folgenden Webserver 4 genannt,
geführt.
Generell können
Anfragen 3 auch auf mehrere Webserver 4 geführt werden.
Weiterhin können
auch Netzwerke 1 mit anderen Servern eingesetzt werden. Zur
Generierung einer Antwort 5 auf eine Anfrage 3 wird
diese vom Webserver 4 einem Applikations-Server 6 zugeführt, der
die Anfrage 3 bearbeitet. Im vorliegenden Fall besteht
die Abarbeitung von Anfragen 3 in der Suche nach bestimmten
Informationen in einer dem Applikation-Server 6 zugeordneten
Datenbank 7.
-
Der
Webserver 4 und der Applikations-Server 6 sind
jeweils auf nicht gesondert dargestellten Serverrechnern installiert.
Die Datenbank 7 ist typischerweise auf einer von den Serverrechnern
unterschiedlichen Rechnereinheit installiert.
-
Um
eine vom Benutzer über
die Kundenrechner 2 durchgeführte Folge von Anfragen 3 eindeutig zuordnen
und analysieren zu können,
ist dem Webserver 4 ein Benutzungsvorgangserfassungssystem 8 zugeordnet.
Das Benutzungsvorgangserfassungssystem 8 bildet wie der
zugeordnete Webserver 4, ein Softwaremodul und ist mit
diesem auf demselben Serverrechner installiert.
-
Das
Benutzungsvorgangserfassungssystem 8 weist eine Schnittstelle 8a auf, über welche
die einzelnen Anfragen 3 und Antworten 5 in einen
Logger 9 eingelesen werden. Dort wird aus diesem Anfragen 3 und
Antworten 5 ein Logfile generiert, der in einer Speichereinheit 10,
wie zum Beispiel einer Festplatte gespeichert wird.
-
Von
dort wird der Logfile in eine Analyseeinheit 11 eingegeben.
Generell können
die Logfiles von mehreren derartigen Systemen mit Kundenrechner 2 und
daran gekoppelten Server in die Analyseeinheit 11 eingegeben
werden. Hierzu weist die Analyseeinheit 11 wie in 1 dargestellt
eine Eingangsstruktur 12 auf, über welche parallel mehrere
derartige Logfiles eingelesen werden können.
-
In
der Analyseeinheit 11 erfolgt eine Auswertung der Logfiles
zur Ermittlung des Benutzerverhaltens von Benutzern. Da die Logfiles
von Speichereinheiten 10 in die Analyseeinheiten 11 eingelesen
werden, erfolgt die Auswertung in der Analyseeinheit 11 zeitlich
entkoppelt von den Anfragen 3 der Kundenrechner 2.
-
In
der Analyseeinheit 11 ist ein Logfilemerger 13 integriert,
der die einzelnen eingelesenen Logfiles zu einem gesamten Logfile
zusammenfasst, wobei bei dieser Zusammenfassung die korrekte zeitliche Reihenfolge
der einzelnen Anfragen 3 beziehungsweise Antworten 5 erhalten
wird.
-
In
einem nachgeordneten Logfilefilter 14 erfolgt ein semantisches
Aufbereiten des Gesamt-Logfiles, wobei im Logfilefilter 14 Kriterien
definiert werden können.
Diese können
bereits im Logfile enthalten sein oder im Logfilefilter 14 berechnet
oder definiert werden und dann in den Logfile eingefügt werden.
-
Derartige
Kriterien können
beispielsweise von Oberbegriffen von spezifischen Daten, die im Logfile
enthalten sind, gebildet sein.
-
Hat
beispielsweise ein Benutzer eine Anfrage zur Recherche nach gestreiften
Anzügen
an eine Datenbank eines Kaufhauses gerichtet, so ist ein geeigneter
Oberbegriff, das heißt
ein Kriterium für
den Begriff „gestreifter
Anzug" der Oberbegriff „Herrenmode". Dies kann bei Abarbeitung
der Anfrage 3 durch den Server dieser Oberbegriff bereits
im Logfile enthalten sein. Alternativ kann das Kriterium „Herrenmode" auch im Logfilefilter 14 generiert
werden.
-
Dem
Logfilefilter 14 ist ein Logfilesplitter 15 nachgeordnet,
in welchen aus dem Logfile Populationen dadurch gebildet werden,
dass als Bedingung wenigstens ein Kriterium in der Session erfüllt sein muss.
Diese Populationen bilden somit Untermengen des Logfiles. Weiterhin
wird auch eine Population All generiert, die dem ursprünglichen
Logfile entspricht.
-
Diese
Populationen werden dann in einzelnen Bewertungseinheiten 16 zur
Generierung von Kenngrößen des
Benutzerverhaltens ausgewertet. Diese Kenngrößen werden dann als Ergebnisdateien aus
der Analyseeinheit 11 ausgegeben und beispielsweise in
einem externen Auswertesystem 17 graphisch aufbereitet.
-
2 zeigt
ein erstes Beispiel eines Logfiles. Generell weist ein solcher Logfile
große
Datenmengen auf. Der Übersichtlichkeit
halber umfasst der Logfile gemäß 1 nur
sieben Aktionen, das heißt sieben
Anfragen 3 des Kundenrechners 2 auf welche jeweils
eine Antwort 5 generiert wurde. Die einzelnen Aktionen
sind im Logfile durch Zeitstempel T1 ... T7 gekennzeichnet, wobei
jeder Zeitstempel durch den Zeitpunkt der Antwort 5 auf
die jeweilige Anfrage 3 einer Aktion definiert ist. Der
Logfile ist nach aufsteigenden Zeitpunkten (Zeitstempeln) geordnet.
Weiterhin sind für
die einzelnen Aktionen die Session-ID S1, ... S4 im Logfile enthalten.
Diese Session-ID werden vom Applikations-Server vergeben und kennzeichnen
die jeweilige Session in der die jeweilige Anfrage bearbeitet wurde.
Ebenso können
die Session-ID vom Benutzungsvorgangserfassungssystem 8 vergeben
werden. Schließlich
sind im Logfile unterschiedliche Kriterien crit1 ... crit7 enthalten,
wobei im vorliegenden Fall jeder Aktion ein solches Kriterium zugeordnet
ist. Schließlich
sind in 2 als Hilfsgrößen sogenannte
Clicks C1 ... C3 aufgeführt.
Diese sind nicht Bestandteil des Logfiles sondern kennzeichnen die
einzelnen Aktivierungen unterschiedlicher Sessions. So kennzeichnet
bei der ersten Aktion mit dem Zeitstempel T1 der Click C1, dass
die Session S1 zum ersten Mal gestartet wurde. Entsprechend kennzeichnet
der Click C2 in der Aktion mit dem Zeitstempel T5, dass dort die
Session S1 zum zweiten Mal gestartet wurde. Ebenso kennzeichnen
die Clicks C1, C2 beziehungsweise C3 in den Aktionen mit den Zeitstempeln
T2, T3 beziehungsweise T4, dass die Session S2 zum ersten, zweiten
beziehungsweise dritten Mal gestartet wurde.
-
3 zeigt
einen ersten Schritt der Auswertung des Logfiles gemäß 2,
der mit einer Bewertungseinheit 16 der Analyseeinheit 11 durchgeführt wird.
Im vorliegenden Fall erfolgt die Auswertung anhand der Population
All, das heißt
dem vollständigen Logfile.
-
Wie
aus 3 ersichtlich, werden die einzelnen Aktionen des
Logfiles nach Sessions sortiert. Für diese einzelnen Sessions
können
Subprozesse 1 ... 4 gebildet werden, die dann wie in 3 dargestellt parallel
ausgewertet werden können.
Die zu den einzelnen Sessions gehörenden Aktionen sind jeweils nach
aufsteigenden Zeitstempeln geordnet.
-
Dabei
kann diese Auswertung bevorzugt zeitaufgelöst erfolgen. Dies ist im Zeitdiagramm
von 4 veranschaulicht, welches die Start- und Endzeitpunkte
der Sessions S1 ... S4 der Logfiles zeigt. Die Auswertung des Logfiles
erfolgt dabei in diskreten Zeitintervallen I, II, III, deren Dauer
beispielsweise jeweils eine Stunde beträgt.
-
Die
entsprechende Auswertung für
die einzelnen Zeitintervalle I, II, III ist in 5 veranschaulicht.
Die in der Analyseeinheit 11 vorgenommene Auswertung erfolgt
derart, dass für
die einzelnen Sessions, deren Aufteilung in 3 beschrieben
ist und deren Zeitverlauf in 4 dargestellt
ist, sogenannte Areas gebildet werden. Die Bildung einer Area für die Sessions
erfolgt derart, dass für
wenigstens ein Kriterium der Sessions eine Mengenbedingung gebildet
wird.
-
Für das Ausführungsbeispiel
gemäß den 2 bis 4 kann
eine derartige Area beispielsweise derart gebildet werden, dass
als Mengenbedingung geprüft
wird, welche Sessions das Kriterium crit1 erfüllen. Als Ergebnis wird die
Zahl 2 erhalten, da diese Bedingung für die Aktion bei T1 (Sessions S1)
und die Aktion bei T4 erfüllt
ist. Die Zählung
der zugehörigen
Clicks ergibt ebenfalls die Zahl 2. Weiterhin wird die Zeitdauer
dieser ermittelten Sessions als weitere Kennzahl, der sogenannten
Viewtime ermittelt. Die Zeitdauer für die Sessions S1 beträgt T5 – T1, da
sie zum Zeitpunkt T1 startet und zum Zeitpunkt T5 die Session S1
von neuem gestartet wird. Die Session S2 wird zum Zeitpunkt T4 gestartet.
Jedoch gibt es hier keine Nachfolgeaktion im Logfile, mit welcher
S2 nochmals gestartet wird. Daher wird hier als Durchschnittszeit
der Wert Avg (Average) gesetzt. Dies führt in der Summe zur Viewtime
T5 – T1 +
Avg. Diese bildet mit dem Zahlenpaar 2, 2 für die Sessions und Clicks die
die Bedingung crit1 ist erfüllt eine
Area. Generell können
auch größere Anzahlen verschiedener
Eigenschaften zur Bildung von Areas herangezogen werden.
-
5 zeigt
die entsprechende zeitaufgelöste
Area-Auswertung für
den Zeitverlauf der Sessions in 4. Dabei
erfolgt die Auswertung derart, dass für die einzelnen Zeitintervalle
I, II, III immer die Sessions ausgewertet werden, die im entsprechenden Zeitintervall
I, II oder III enden. Im Beispiel gemäß 4 endet
im Zeitintervall I keine Session, so dass dort überhaupt keine Auswertung stattfindet.
-
Dagegen
endet im Zeitintervall II die Session S2, so dass, wie in 5 dargestellt,
gemäß dem Subprozess
2 in 3 hier die Session S2 ausgewertet wird.
-
Als
Normierungsgröße wird
zunächst
die Area „All" gebildet, das heißt es werden
alle Sessions S2 betrachtet, unabhängig von der Erfüllung eines Kriteriums.
Wie in 3 dargestellt, wird die Session S2 mit den Clicks
C1, C2, C3 der Aktionen zu den Zeitpunkten T2, T3, T4 dreimal aktiviert,
das heißt
die Anzahl der Clicks für
die Area All beträgt
3. Die Viewtime hierfür
beträgt
(T3 – T2)
+ (T4 – T3)
+ Avg, da die erste Aktivierung der Session S2 zum Zeitpunkt T2 durch
den Click C2 bei T3 beendet wird, die zweite Aktivierung von S2
bei T3 mit dem Click C3 bei T4 beendet wird und nach der Aktivierung
der Session S2 bei T4 kein Nachfolger mehr existiert, so dass hier
die Durchschnittszeit Avg angesetzt wird. Die Area All wird schließlich komplettiert
durch die Zahl der Session im Zeitintervall II. Diese ist eins,
da dort nur die Session S2 endet.
-
Als
weitere Area im Zeitintervall II wird die Area „crit1 erfüllt" gebildet. Da das Kriterium der Area „crit1
erfüllt" nur für die Aktion
bei T4 erfüllt
ist, ist die Anzahl der Clicks in diesem Fall 1. Da die Aktion bei T4
keinen Nachfolger hat, nimmt die Viewtime den Wert Avg an. Die Anzahl
der Sessions beträgt
wieder 1.
-
Im
Zeitintervall III des Diagramms gemäß 4 enden
drei Sessions, nämlich
S1, S3 und S4.
-
Die
entsprechende Area-Auswertung für
das Zeitintervall III zeigt wieder 5. Hierbei
wird wieder die Area „All" gebildet, da alle
Sessions S1, S3, S4 ohne die einschränkende Bedingung, ob ein Kriterium
erfüllt
ist, berücksichtigt
werden. Da im Zeitintervall III drei Sessions (S1, S3, S4) enden,
beträgt die
Anzahl der Sessions 3. Da für
die Session S1 zwei Clicks (bei den Aktionen zu den Zeitpunkten
T1, T5) und für
die Sessions S3, S4 jeweils nur ein Click existieren, beträgt die Anzahl
der Clicks 4. Die Zeitdauer für
die Sessions S1 beträgt
T5 – T1
+ Avg. Die Zeitdauer für
die Session S3, ebenso wie die Zeitdauer für S4, beträgt Avg, so dass sich als gesamte Viewtime
der Wert (T5 – T1)
+ 3; Avg ergibt.
-
Weiterhin
wird auch für
das Zeitintervall III die Area „crit1 ist erfüllt" gebildet. Da crit1
nur bei der Session S1 in der Aktion zum Zeitpunkt T1 erfüllt ist, ist
für diese
Area die Zahl der Sessions 1 und die Zahl der Clicks 1. Da diese
Session S1 zum Zeitpunkt T1 durch den neuen Start der Session S1
bei T5 beendet wird, beträgt
die Viewtime (T5 – T1).
-
Diese
zeitaufgelöste
Area-Auswertung kann beispielsweise in der Graphik gemäß 6 visualisiert
werden. Dieses Zeitdiagramm zeigt den zeitlichen Verlauf der Anzahl
der Sessions für
die Area All (durchgezogene Linie) und die Area „crit1 ist erfüllt" (gestrichelte Linie)
zu den Zeiten I, II, III gemäß dem Zeitraster
von 4. Mit derartigen Diagrammen kann beispielsweise
genau analysiert werden, wie sich der Anteil bestimmter Kriterien
im Verhältnis
zur Gesamtzahl der getätigten
Anfragen 3 verhält.
-
7 zeigt
ein weiteres Beispiel eines Logfiles. Der dort dargestellte Logfile
stellt eine Erweiterung des Logfiles der 2 und 3 dahingehend dar,
dass neben den dort angeführten
Kriterien crit1 ... crit7 in einer UND-Verknüpfung jeweils ein weiteres
Kriterium a oder b in jeder Aktion definiert ist. Dabei sind den
Kriterien a, b zudem konkrete Inhalte, das heißt Werte zugeordnet. Dem Kriterium
a sind die Werte radio, auto oder dvd zugeordnet. Dem Kriterium
b ist als Wert eine ja- oder nein-Aussage zugeordnet. Der Logfile
gemäß 7 ist
analog zur Auswertung gemäß 3 bereits
nach Sessions sortiert.
-
Aus
dem Logfile gemäß 7 werden,
wie in den 8 und 9 dargestellt,
verschiedene Populationen gebildet. 8 zeigt
die Bildung der Population „All", das heißt dieser
Population ist vom Logfile gemäß 7 selbst
gebildet.
-
9 zeigt
eine Population, die als Untermenge des Logfiles gemäß 7 gewonnen
wird, in dem als Bedingung „Kriterium
a ist vorhanden" gestellt
wird. Diese Bedingung für
die Sessions S1, S2, S3 erfüllt,
so dass diese die Population „enthält a" bilden.
-
Für die beiden
Populationen erfolgt eine Area-Auswertung, die der Auswertung gemäß 5 entspricht.
Dabei ist in den Ergebnis-Tabellen der 8, 9 die
Auswertung der Viewtime nicht gesondert dargestellt. Vielmehr sind
in den Tabellen der 8, 9 nur bei
der Area-Auswertung ermittelten Anzahlen der Sessions und Clicks
dargestellt, die im vorliegenden Fall eine nicht zeitauf gelöste Auswertung
enthalten. Weiterhin ist in den Tabellen die auf die Anzahl der
Session für
die Area All normierte Anzahl der Sessions aufgetragen.
-
Da
die Population All (8) vier Sessions S1, S2, S3,
S4 enthält,
ist die Anzahl der Sessions für die
Area All 4. Da diese Anzahl die Normierungskonstante bildet, ist
die normierte Zahl der Sessions für die Area All eins. Die Anzahl
der Sessions für
die Area, die durch die Bedingung „Kriterium 1 ist erfüllt" definiert ist, ist
2, da diese Bedingung für
die Sessions S1, S2 erfüllt
ist. Die normierte Anzahl der Sessions beträgt 0,5. Entsprechend wird für die Area,
die durch die Bedingung „a
ist erfüllt" definiert ist, als
Anzahl der Sessions 3 erhalten, da diese Bedingung für die Sessions
S1, S2, S3 erfüllt
ist. Die normierte Anzahl der Sessions beträgt 0,75. Schließlich wird
für die
durch die Bedingung „b
ist erfüllt" definierte Area die
Anzahl von drei Sessions erhalten, da diese Bedingung für die Sessions
S1, S2, S4 erfüllt
ist.
-
Für die Area „All" in der Population „All" gemäß 8 werden
insgesamt 7 Clicks bei T1, T2, T3, T4, T5, T6, T7 registriert. Die
Area „crit1
ist erfüllt" enthält 2 Clicks
(bei T1, T4), die Area „a
ist erfüllt" enthält 4 Clicks
(bei T1, T2, T4, T6), die Area „b ist erfüllt" enthält 3 Clicks (bei T5, T3, T7).
-
Die
Area-Auswertung für
die Population „enthält a" gemäß 9 erfolgt
analog zur Auswertung gemäß 8.
Da in der Population gemäß 9 nunmehr
die Session S4 nicht mehr enthalten ist, werden für die Area
All nur noch 3 Sessions und 6 Clicks erhalten. Entsprechend werden
für die
weiteren Areas die in der Tabelle von 9 dargestellten Werte
erhalten.
-
Die
normierten Anzahlen der Sessions, die in den Area-Auswertungen der
Tabellen von 8, 9 erhalten
wurden, können
wie in 10 dargestellt in einem Vektordiagramm
dargestellt werden. Die Koordinatenachsen sind von den normierten Werten
der Areas crit1, a, b gebildet. In dieses Koordinationssystem werden
die normierten Anzahlen der Sessions für die Population All (durchgezogene
Linie) und die Population „enthält a" (gestrichelte Linie) ein getragen.
Dadurch wird ein schneller optischer Vergleich unterschiedlicher
Populationen ermöglicht.
-
11 zeigt
eine Liste, die für
die Area „a
ist da" der Population „All" aus dem Logfile
gemäß 7 gewonnen
wurde. Diese Liste enthält
die Anzahlen der Sessions und Clicks, für welche jeweils für das Kriterium
a die konkreten Inhalte „radio", „auto" oder „dvd" realisiert sind.
-
- 1
- Netzwerk
- 2
- Kundenrechner
- 3
- Anfrage
- 4
- Webserver
- 5
- Antwort
- 6
- Applikations-Server
- 7
- Datenbank
- 8
- Benutzungsvorgangserfassungssystem
- 9
- Logger
- 10
- Speichereinheit
- 11
- Analyseeinheit
- 12
- Eingangsstruktur
- 13
- Logfilemerger
- 14
- Logfilefilter
- 15
- Logfilesplitter
- 16
- Bewertungseinheit
- 17
- Auswertesystem