Hier, le blog officiel Google a publié un billet précisant que dorénavant, Google tentera de remplir automatiquement des formulaires pour explorer davantage de pages. Dans une certaine mesure, bien sûr.
Ce changement est inquiétant. En règle générale, les formulaires sont faits pour les utilisateurs, pas pour les moteurs et encore moins pour que les moteurs n’entrent des termes aléatoires au risque de dévoiler une partie de votre base de donnée.
Toutefois, Google a posé quelques limites à ce crawling :

  1. Seront exclus tous les formulaires en POST (ils ne peuvent pas faire autrement)
  2. Ce crawl ne sera appliqué, en tous cas au départ, qu’aux gros sites
  3. Tous les formulaires ressemblant à des formulaires personnels (logins etc.) ne seront pas utilisés
  4. Le nombre de validation de formulaires sera faible
  5. Les entrées de formulaires seront contextuelles au site (elles pourront donc avoir un certain intérêt)

De plus, selon Google, il n’y aura pas de transmission de PR par la page du formulaire, ni de problème de duplicate content “significatif”…

L’opération, bien sûr, comme il est dit, augmentera la taille de l’index et permettra à vos sites d’être mieux indexés. Mais comme répond Anthony en commentaires :

Ne réalisez-vous pas que ceux qui faire indexer des résultats de formulaires vous proposent déjà ces résultats sur d’autres pages ?

P.S. : par ailleurs, Google précise dans ce billet qu’ils crawlaient depuis longtemps les Javascript et les Flash

[À voir : Official Google Blog]