Hoe groot de index van Google juist is was een tijdje voor iedereen gissen. Enkele jaren geleden heeft men namelijk de vermelding hoeveel pagina’s men had geïndexeerd verwijderd van de Google zoekpagina. Men wou niet langer meedoen aan de race om de grootste zoekindex te hebben.
Afgelopen week echter heeft men bij Google officieel bekend gemaakt dat ze meer dan 1 triljoen unieke webpagina’s hebben geïndexeerd. Geen enkele andere zoekmachine komt in de buurt van dit aantal. Om even te schetsen dat dit aantal pijlsnel de hoogte is gegaan. Toen Google in 1998 werd gelanceerd bevatte de index 26 miljoen webpagina’s. In 2000 was dit opgelopen tot 1 biljoen pagina’s en een kleine 8 jaar later heeft men de triljoen grens doorbroken.
Deze aantallen tonen nogmaals het belang aan van zoekmachine optimalisatie & zoekmachine advertising. Zonder degelijke strategie voor je website drijgt je website ergens in de anonieme massa van webpagina’s te verzinken!
Lange tijd ging iedereen er vanuit dat de extensie van een webpagina geen rol speelde voor de zoekmachines. Of het nu een .php, .jsp, .html, .pdf, .exe, .tar, … was de zoekmachines zouden het wel kunnen indexeren.
Nu leerde onze eigen ervaring ons dat de extensie wel degelijk een invloed heeft op de indexatie van een webpagina. Recent heeft Matt Cutts van Google dit ook officieel bevestigd op zijn blog.
Het is dan ook aan te raden om enkel extensies die geassocieerd worden met webpagina’s zoals .html, .php, .asp, .jsp, .. te gebruiken en niet te kiezen voor extensies die gebruikt worden om programma’s, video’s, afbeeldingen, .. aan te duiden zoals .jpg, .wmv, … Wanneer u twijfelt of een extensie mag gebruikt worden kan u best even volgende opdracht ingeven in Google: [filetype:exe]. Wanneer u resultaten krijgt die eindigen op uw extensie dan kan u zeker zijn dat uw webpagina geïndexeerd kan worden. Indien u geen resultaten krijgt kan u het best opteren voor een andere extensie voor uw webpagina.
Er zit wel een addertje onder het gras. Wanneer u namelijk gebruik maakt van een CMS (content management systeem) en bijvoorbeeld een folder “Web2.0″ aanmaakt kan het zijn dat uw cms systeem dit omzet naar www.url.be/web2.0. Wanneer de zoekmachines dit proberen te indexeren beschouwen zij dit als de extensie “0″. Deze wordt echter niet beschouwd als een extensie voor een webpagina en de pagina zal dan ook niet opgenomen worden in de index.
Om dit te voorkomen kan u best uw CMS systeem aanpassen zodat er steeds een “/†wordt toegevoegd zodat de url er zo gaat uitzien: www.url.be/web2.0/.Nog beter is om te zorgen dat uw CMS automatisch de “.†gaat verwijderen uit de naam van folders en webpagina’s. Omdat wanneer iemand linkt naar de pagina in kwestie hij misschien niet de “/†zal meenemen die op het einde staat en eigenlijk linkt naar www.url.be/web2.0 waardoor het probleem zich opnieuw dreigt te stellen.
Update: Google heeft zijn policy bijgewerkt en de “.0†wordt nu wel geïndexeerd maar nog lang niet alle extensies worden geïndexeerd dus blijven we aanraden om steeds een controle te doen op de extensies van uw webpagina’s en folders.