par Olivier

Web sémantique, Google Knowledge Graph et cartographie

30 octobre 2012 dans Cartographie/MindMap
1 commentaire »

Sortie en mai 2012 aux US, Knowledge Graph est annoncé comme l’outil qui ferra du célèbre moteur de recherche un moteur de savoir ! @fmeichel (via la veille collaborative puis un commentaire) pointe ce service du doigt 🙂 J’initie cet article pour permettre de rassembler ici les quelques informations glanées sur le sujet … et nos impressions !

Comment Google arrive a donner du sens aux pages qu’il référence ? Comme toutes les technologies G., difficile de le savoir !! Les 2 mêmes chiffres ressortent des différents articles que j’ai pu lire :

500 millions d’objets
3,5 milliards de liens entre ces objets

J’imagine que la recherche se base sur une cartographie reliant les pages web par des mots clefs.
Cela me rappelle donc la Google Wheel, un service lancé par G. en 2009 et disparu en 2011 pour cause « d’entretien trop couteux » !!
Pour plus d’info sur Google Whell, lisez donc « Kartoo est mort, vive la roue  magique de Google!« .

L’idée est en tout cas là même : relier les pages entres elles avec des mots clefs.
Les mots clefs sont jusqu’à présent issus :

  • du contenu de la page (les mots sont utilisés dans le corps de la page)
  • du contenu des liens pointant sur la page (=d’un contenu provenant d’autres pages, voire d’autres sites)
  • des habitudes des internautes (après avoir vu cette page, 70% des internautes cliquent ici)

Voici une démonstration vidéo:

 

Ces mots clefs sont donc extraits du contenu web et posent 2 problèmes de pertinence :

  • cas d’une page lié à un mot clef non équivoque (sur cet article, le mot « internaute » ressort plusieurs fois, cependant il n’a pas de réel « sens »)
  • cas d’une page non lié à un mot clef mais qui devrai pourtant l’être (les termes  « algorithme de recherche » ne ressortent pas de cet article, hors c’est pourtant directement lié au « sens » de cet article)

Dans la vidéo ci-dessus, on repère tout en haut des SERP (Search Engine Result Page) un bandeau présentant les résultats proposés par Knowledge Graph :

A partir des seuls mots clefs « female politicians« , le moteur de recherche identifie les pages qui répondent à ces critères et les affiches avec une pertinence qui semble être « Frequently mentionned« .

Sans en savoir plus, il est difficile de mesurer l’évolution que ce service apporte. Au moins avec G. Wheel, c’était l’internaute qui cliquait sur les mots clefs et choisissait ainsi le sens qu’il voulait donner à se recherche 🙂

Je ne suis même pas sur que l’on puisse vraiment parler de Web sémantique … car la sémantique réside dans la magie qui s’opère lorsque G. associent les pages web avec des mots clefs pertinents … et sur ce sujet, je n’ai pas trouvé d’information 🙁

La pertinence des  résultats sera-t-elle meilleure grâce à ce service ? Certes on identifiera plus rapidement les informations les plus citées/consultées. On identifiera donc plus facilement les informations populaires.

Cependant populaire n’est ni un synonyme de pertinent, ni de savoir !

Le fait de mettre en avant ce qui est populaire, peu avoir pour conséquence de rendre moins visible les autres informations et peu donc avoir un impact sur l’émergence des nouveaux savoirs. Sur Apprendre 2.0 nous insistons souvent sur un des gros intérêts du web : permettre aux individus de connecter les informations entres elles afin de faire émerger de nouveaux savoirs. Difficile de faire émerger de nouveaux savoirs si l’on se contente des résultats « Frequently Mentionned » !🙁

Il est difficile de trouver LA solution pour nous permettre de MIEUX bénéficier de tout le contenu aujourd’hui disponible sur internet. Le Knowledge Graph de G. est bien une évolution, mais il va par contre falloir apprendre à s’en servir correctement !