Google Analytics und der Datenschutz

Google Analytics LogoNachdem Google in jüngster Zeit durch die Aufzeichnung von WLAN-Nutzdaten ein datenschutz- und PR-technischer Super-GAU unterlaufen ist, setzt sich das Unternehmen nun für ein wenig mehr Datenschutz für seine Kunden ein. Die Neuerungen betreffen das Website-Analyse-Tool Analytics, das auf zahlreichen Webseiten zum Einsatz kommt.

Analytics ermöglicht es dem Webseitenbetreiber, Daten über seine Besucher, z.B. Herkunft, Browser, Auflösung und Referer-URL, einzusehen und automatisch auswerten zu lassen. Auch werden die Daten von Google selbst weiterverwendet. Diese Praktik ist unter Datenschützern zu Recht umstritten und es ist fraglich, ob Google Analytics in dieser Form in Deutschland überhaupt ohne ausdrückliche Zustimmung des Nutzers verwendet werden darf.

Bei den Neuerungen handelt es sich zum einen um eine Browser-Erweiterung, die das Ausführen des Analytics-Codes verhindert und zum anderen um eine Technik zur Verschleierung der Identität des Nutzers, bevor die Daten an Google übermittelt werden. Erstere kann von den Nutzern selbst eingerichtet werden und wirkt sich auf das Verhalten aller Webseiten aus. Letztere kann nur von den Webseitenbetreibern eingerichtet werden und gilt daher nur für Besuche der jeweiligen Webseite.

Google Analytics OptOut-Browser-Erweiterung

Die Erweiterung wird für die Browser Internet Explorer 7 und 8, Firefox ab Version 3.0 und Chrome angeboten und kann hier heruntergeladen werden. Benutzer von exotischeren Browsern wie Opera und Safari gehen leider leer aus.

Die Erweiterung bewirkt, dass das Ausführen des Google-Analytics-Codes auf jeglichen Webseiten verhindert wird. Dadurch fällt es Google wesentlich schwerer, ein detailliertes Nutzerprofil anzulegen, denn es wird nicht mehr darüber informiert, welche Webseiten der Nutzer besucht. Ein Profil kann jedoch immernoch durch die Nutzung anderer Google-Dienste wie der Web-Suche, Google Mail, YouTube oder Buzz angelegt und gepflegt werden.

Google Analytics IP-Masking

Webseiten-Betreiber haben die Möglichkeit, in ihrem Analytics-Code das sogenannte IP-Masking zu aktivieren. Hierdurch werden die letzten 8 bit der IP-Adresse gelöscht, bevor sie an Google übertragen werden, sodass eine eindeutige Identifizierung des Benutzers ausgeschlossen wird. Anhand des verbliebenen IP-Adressen-Fragments kann der Benutzer zwar immernoch einer geografischen Position zugeordnet werden, jedoch weit weniger genau als anhand der kompletten IP-Adresse.

Google macht es Webseiten-Betreibern jedoch schwer, die Neuerungen umzusetzen. Der Code funktioniert nämlich nicht direkt für die aktuelle, asynchrone Version des Trackings, sondern nur für die veraltete (weil langsamere), synchrone Version, an deren Tracking-Code man im Analytics-Account gar nicht mehr rankommen kann. Einige Informationen liefert jedoch die Dokumentation der Analytics-API. Auch diskutieren wir gerade im Analytics-Forum.

Implementierung

UPDATE 01.06.2010: Ich habe jetzt mit Hilfe eines Artikels von Moritz Habermann einen kleinen Workaround gefunden. Das _gaq-Objekt des neuen, asynchronen Trackings kann auch Funktionen als Parameter übernehmen. Innerhalb einer solchen Funktion ist es möglich, auf das _gat-Objekt des synchronen Trackings zuzugreifen. So kann man das IP-Masking in einer Hybrid-Version benutzen. Hier der Code:

<script type="text/javascript">
  var _gaq = _gaq || [];
  _gaq.push(function() {
    _gat._anonymizeIp();
    var tracker = _gat._createTracker('UA-XXXXXXXX-X');
    tracker._trackPageview();
  });
  (function() {
    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
  })();
</script>

Dass man _anonymizeIP für das _gat-Objekt und nicht für das tracker-Objekt aufrufen muss, macht aus meiner Sicht erst einmal wenig Sinn, jedoch funktioniert es nur so und nicht anders.

UPDATE 09.06.2010: Dank des Kommentars hier von Brian Kuhn wissen wir nun auch, dass die folgende Variante ebenso funktioniert. Ob sich dadurch hinsichtlich der Geschwindigkeit etwas tut, kann ich nicht sagen. Letztendlich handelt es sich ja immer noch um eine Art Hybrid aus synchronem und asynchronem Code.

<script type="text/javascript">
  var _gaq = _gaq || [];
  _gaq.push(['_setAccount','UA-XXXXXXXX-X']);
  _gaq.push(['_gat._anonymizeIp']);
  _gaq.push(['_trackPageview']);
  (function() {
    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
  })();
</script>

Um zu überprüfen, ob der anonymisierte Code verwendet wird, kann man die Firefox-Add-Ons Firebug oder Live HTTP Headers verwenden. Ist alles in Ordnung, wird das Zählpixel __utm.gif mit dem Parameter aip=1 aufgerufen. In Firebug sieht das dann so aus (die Analytics Opt-Out -Erweiterung muss dafür natürlich kurzzeitig deaktiviert werden):
Google Analytics Anonymize IP in Firebug

Was haltet ihr von den Neuerungen? Werdet Ihr das Add-On installieren? Richtet Ihr auf Euren Webseiten das IP-Masking ein? Hinterlasst einen Kommentar!

17 Gedanken zu „Google Analytics und der Datenschutz“

  1. UNd warum dann nicht gleich den Schnippsel für das synchrone Tracking verwenden? Wenn ich es recht verstehe, wird hier doch de facto auch wieder auf synchron per _gat umgestellt, nur umständlicher?

    1. @Thomas: Letztendlich muss natürlich irgendwo das _gat-Objekt angesprochen werden, denn Google hat die Funktion anonymizeIP bisher ja nicht in das _gaq-Objekt implementiert. Ob die Ladezeiten mit dieser Hybrid-Methode durch die Verwendung des asynchronen _gaq.push nun geringer sind als bei der rein synchronen Version weiß ich nicht.

  2. Ich bin heute erst auf das Thema gestossen. Habe (vermutlich) noch den alten Code in meiner Seite, den ich aber jetzt um _gat._anonymizeIp(); ergänzt habe.

  3. Wir werden das auf jeden Fall einbauen, auf allen betreuten Seiten. Cool wäre es übrigens, wenn man den Tracking-Status (anonym/nicht anonym) direkt in der GA-Oberfläche beim jeweiligen Profil ablesen könnte…

  4. Ausgezeichnet. Vielen Dank für die Anleitung. Das IP-Masking wird jetzt überall bei mir aktiviert. Verwende jetzt genau den Code wie oben angegeben.

    Was ich aber ehrlich gesagt nicht verstanden habe ist, wie man das mit Firebug oder Live HTTP jetzt genau testet. Ich hab da überall mal ein bischen rumgeklickt, konnte aber nirgendswo was zu diesem Zählpixel finden. Kannst Du da nochmal erklären, wie man das genau prüft, ob das IP-Masking jetzt tatsächlich aktiviert ist.

    1. Hallo Tim!

      Habe noch einen Screenshot von Firebug eingefügt. Du findest die Angabe zu den Parametern im Abschnitt Net. Dort muss Du nach der __utm.gif suchen und noch einmal auf Params klicken. Ist dort ein aip=1 vorhanden, funktioniert alles.

      Gruß,
      Erk

  5. Vielen Dank für diese umfangreiche Erklärung. Damit ist der Einbau ein Kinderspiel.

    Bei Google habe ich noch folgendes gefunden, mit dem ich nichts anfangen kann:
    When using this function to anonymize tracking, you must use the push function and properly associate the function with the tracker object, as illustrated below. Das steht hier: http://code.google.com/intl/de-DE/apis/analytics/docs/gaJS/gaJSApi_gat.html
    Was macht man hiermit?

    Viele Grüße

  6. Hi Erk. Gute Zusammenfassung. Das IP-Masking ist der erste wichtige Schritt und sollte auf jeden Fall gemacht werden. Man muss dann noch den Datenschutzhinweis entsprechend erweitern.
    Aktuell gefällt den Herren vom Datenschutz die Plugin Variante aber noch nicht so recht – mit ein wenig Javascript kann man sich einen „Opt-Out“-Button bauen. Ich habe die Infos zur Einbindung mit Text- und Codebeispielen zum Download auf gepostet: http://www.econtrolling.de/datenschutz-google-analytics/

    Für Webmaster, die es ganz sicher machen wollen, gibt es da auch eine Anleitung, wie man die IP-Adresse komplett für sich behält.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.