12/05/2008

En attendant la recherche sémantique

Author: Romain Dehaudt, Head of Revenue & Operations

Avec la croissance de surface de recherche, en étendue et en profondeur, plus personne ne doute des limites des outils par mots-clés, aussi intelligents soient-ils.
Outre la capacité d’indexation de l’espace (on oublie ou on ignore souvent que Google lui-même n’indexe vraiment qu’une faible partie du web), la question vraiment posée à la recherche est celle de la performance, dans l’habilité à servir du résultat de qualité, en quantité, bien hiérarchisé, le tout rapidement et sans trop de complexité pour l’utilisateur lambda.
Tout cela ressemble un peu à la quadrature du cercle et avait bien été résumé par des documentalistes avec lesquels j’avais dialogué lors d’une table ronde sur l’enterprise 2 appliqué à une grande administration régalienne : sur un corpus informationnel dont l’unité de base est du To textuel, les gens cherchent généralement avec 2 mots-clés, ce qui produit beaucoup de bruit, peu de signal et beaucoup de frustrations. Comment faire ?


Je n’étonnerai personne en disant que les regards sont tournés vers la technologie et tout particulièrement vers le web sémantique. C’est sur ce terrain-là qu’on l’attend et à ce titre, Nova Spivac, de Radar Networks, a produit les slides qu’il fallait cette année. Sauf que Nova Spinack a l’honnêteté de fixer l’horizon à la (fin de la) prochaine décennie, ce qui n’est pas vraiment en phase avec l’impatience du public averti qui l’écoute. Quand on (le web moderne) a 13 ans, 20 ans c’est loin, même si on est pressé de grandir.

De fait, toute annonce qui mixe recherche et microformats suscite de grandes espérances. C’est typiquement le cas avec PowerSet, et Ouriel a bien raison de souligner que le terrain est surtout favorable au buzz et aux manoeuvres capitalistiques qui lui sont liées.
D’ailleurs, il est révélateur que PowerSet se garde bien d’aller se confronter au search grand public, trop vaste et trop exigeant. Se limiter à Wikipedia est malin et permet une comparaison sur un territoire d’expérimentation très courru. Cela donnera ainsi l’occasion de mesurer la recherche sémantique type PowerSet avec d’autres, notamment en terme de social search, le trend précédent. Déjà, l’expérience utilisateur qu’il procure est meilleure qu’avec la recherche par mots-clés, c’est déjà ça.
Au passage, le sémantique c’est bien plus que des mots(-clés). C’est du sens, de la culture, des langues et, à ce titre, jouer un peu en français avec PowerSet me semble bien confirmer les craintes que l’on peut avoir sur l’importance de notre culture à rester dans la course. Soutenir le dynamisme entreprenarial des français et européens des microformats, voilà une bonne entrée pour la todo de M. Eric Besson.
Cela dit, s’il y a grand intérêt à suivre et tester ce qui se passe, il faut bien faire autre chose en attendant car les corpus augmentent et la frustration des utilisateurs à l’avenant. C’est typiquement un des gros enjeux de l’enterprise 2.0 et même un des moteurs de son développement.
La première idée qui vient, c’est de faire en sorte que son monde pour qu’ils saisissent autre chose que 2 mots-clés. Mais même moi qui travaille au corps la gouvernance de l’information et la recherche de la Haute Qualité Informationnelle par l’utilisateur, je préfère être réaliste sur l’exigence de changement d’une démarche visant à éduquer les utilisateurs à élever le niveau de leurs requêtes pour tirer vraiment profit des capacités des moteurs.
Pourtant, il suffit assez simplement de dépasser la solution toute faite du moteur à tout trouver et de se pencher un tant soit peu sur son architecture informationnelle pour découvrir de fantastiques gisement de performances.
Et puis il aussi la capacité du social-software à créer les conditions qui font qu’il est parfois plus efficace de connaître sinon trouver celui qui a l’information la connaissance plutôt que l’information elle-même. Sur ce terreau, les microformats sont déjà de bons facilitateurs et sans attendre un septennat.
En attendant des outils plus intelligents que nous, l’intelligence collective n’est pas motorisée par des robots, mais par nos cerveaux et notre capacité à faire vivre du projet et de la culture métier.

gallery image