Open Source CMS Marktanteile in Deutschland
Zusammenfassung
- Untersucht wurden gut 50.000 .de-Domains.
- mit dem Werkzeug whatweb
- Ergebnis: Wordpress, TYPO3 und Joomla machen 20% der Websites aus, die anderen genannten CMS haben insg. nur 3% Marktanteil.
In einer kleinen privaten Studie hab ich versucht, zu untersuchen, wie verbreitet Open Source CMS Systeme sind. Als Datenbasis für die Domains habe ich eine Liste verwendet, die 54222 .de-Domains umfasst, es sind die deutschen Top-Sites (aus einer Million weltweiter Sites), die Alexa Ende 2008 veröffentlichte. Nicht ideal, aber ich habe derzeit nichts Besseres zur Verfügung. Diese Domains wurden mit whatweb untersucht, das Systeme anhand von Metatags, Cookies, HTTP-Headern, Backlinks usw. erkennt. Hier die CMS in Reihenfolge der Häufigkeit in meinen Ergebnissen:
- Wordpress (8.83%)
- TYPO3 (6.86%)
- Joomla (4.30%)
- Drupal (1.30%)
- Contao (0.33%)
- PHPNuke (0.23%)
- ModX (0.22%)
- eZ Publish (0.20%)
- Serendipity (0.17%)
- MediaWiki (0.15%)
- Plone (0.15%)
- DotNetNuke (0.08%)
- Movable Type (0.08%)
- OpenCMS (0.7%)
- PHPFusion (.06%)
- PostNuke (.05%)
- Silverstripe (.05%)
- CMS Made simple (.05%)
Insgesamt machen die TOP 3, nämlich Wordpress, TYPO3 und Joomla circa 20% der untersuchten 54222 Websites aus. Nimmt man Drupal hinzu, sind es gut 21% (21.29%). Insgesamt fallen 23% (23.19%) auf alle genannten Systeme, daran sieht man, dass die restlichen verglichen mit den wenigen Top-Kandidaten einen sehr geringen Marktanteil haben. An fünfter Stelle steht Contao, jedoch mit großem Abstand zu Drupal.
Einschränkungen
Die Untersuchung hat einige Schwächen, die ich kurz diskutieren will.
- Die verwendet Domain-Liste ist von Ende 2008, das heißt, dass das seit Veröffentlichung der Alexa-Liste circa 3 Millionen Domains hinzugekommen sind (basierend darauf, dass im Jahr circa 1 Million neue .de-Domains registriert werden, dazu die denic-Statistiken). Außerdem ist es keine Zufallsstichprobe, weil es sich um die Alexa-Top-Sites handelt, das finde ich persönlich aber in Ordnung, weil mich große/gutbesuchte Websites ohnehin mehr interessieren.
- Es gibt keine Garantie dafür, dass ein CMS korrekt erkannt wird. Die Merkmale, anhand derer whatweb ein System identifiziert, lassen sich ausschalten oder ändern, wenn der Webmaster das möchte. Es ist auch unklar, ob die Erkennung, warum auch immer, nicht zufällig über alle System hinweg fehlschlägt, Resultat wäre ein Bias zuungunsten der schlechter erkennbaren Systems. Es wäre sehr aufwendig, festzustellen, ob das so ist.
Fazit
Insgesamt denke ich, dass meine Ergebnisse eine vernünftige Validität haben. Die Zahlen von CMScrawler weichen von meinen etwas ab, evtl. sind sie besser, weil sie über 2 Millionen .de-Domains untersuchen, aber wie die Domain-Liste zustande kommt, konnte ich nicht rausfinden. Es wundert mich, dass Wordpress bei CMScrawler hinter TYPO3 und Joomla liegt. Falls jemand eine vollständige Liste aller .de-Domains hat, freu ich mich, wenn er sie mir zukommen lässt. ;)