Comment et combien de lignes textuelles lisent les internautes

On the average Web page, users have time to read at most 28% of the words during an average visit; 20% is more likely (Nielsen 2006).

Nielsen, le célèbre auteur de "Don't make me think", vient de publier un article synthétique sur l'étude "How Little Do Users Read" menée par Harald Weinreichs. On remarquera au passage son style simple et cependant amélioré si on regarde son site auparavant.
Cette étude ne surprendra pas étant donné la quantité d'informations qui passent sous nos yeux lorsqu'on consulte des sites ou qu'on recherche une information. L'étude confirme que les internautes ne lisent pas, mais scannent le texte qui nous est donné à lire.

Pour plus d'informations :
Harald Weinreich, Hartmut Obendorf, Eelco Herder, and Matthias Mayer. 2008. Not Quite the Average: An Empirical Study of Web Use. ACM Transactions on the Web 2, no 1 : article #5.

Colloque Carto 2.0

Le 3 avril 2008 se tenait un colloque sur la cartographie d'informations et ses différents courants. La cartographie d'informations repose sur une visualisation d'un espace de données abstraites reposant sur les paradigmes de la cartographie (Tricot, 21). Les actes sont d'ores et déjà téléchargeables en version .pdf.
Voici une synthèse de ce qui s'est dit et échangé :
synthèse du colloque Carto 2.0
Le nuage rouge montre clairement les avantages de la visualisation et défis que les procédés de visualisation d'informations doivent relever.
Les apports :

  • hiérarchisation
  • facilite la mémorisation
  • interaction : vue globale et navigation dans la masse d'informations

Les défis :

  • sentiment de pertes du savoir
  • sentiment de perdre du savoir écrit dans les représentations habituelles (liste)
  • langage graphique trop unique ou uniforme

Globalement ça rejoint ce que j'ai par moi-même constaté dans mes travaux. Ce qui remet en cause la métaphore visuelle de la carte, le langage graphique et enfin l'évaluation de telles représentations dans des activités de types veille ou recherche d'informations.

Tricot, Christophe. 2006. Cartographie sémantique : des connaissances à la carte. Sous la direction de Christophe Roche, Université de Savoie, http://ontology.univ-savoie.fr/tricot/recherche/CS/these/Cartographie%20semantique%20-%20Christophe%20Tricot%20-%20memoire.pdf

Le second symposium doctoral aura-t-il lieu? Oui

Le site du symposium doctoral Ebsi McGill est en ligne.
Après quelques hésitations : le second symposium réunissant les doctorants des deux écoles de sciences de l'information de Montréal aura lieu à l'université de Montréal, le 21 mai.
L'appel à communication aux doctorants de ces deux écoles a été lancé. Espérons que l'invitation séduise tant les professeurs que nos collègues anglophones.
On a choisi cette année d'innover et d'utiliser un système de gestion de contenu web libre : drupal pour gérer les inscriptions au symposium.
À tous les participants et intervenants nous leur souhaiteront une chaleureuse bienvenue.
Il me reste tout juste quelques détails css à régler.

3x5 life to second life : 35 years of keeping up

Candy Schwartz, professeur à la GSLIS de l'université Simmons, présidente de l'American Society of Information Science and Technology est venue à la GsLIS de Mc Gill présenter une conférence sur l'intégration des innovations estampillées "Web 2.0" dans le domaine de la bibliothéconomie.
Dans le domaine des ressources :
- Google suggest Labs
- Scopus et Google Scholar
- Open content alliance
- Open Library
Dans le domaine de la fourniture, de l'agrégation de contenu :
- RSS4Lib
- Penntags
- LibX
- Library and Dspace
- information commons
- eXtensible Catalog
- iSchools
- Moodle (free software ; logiciel libre)
Je vous laisse découvrir ces différentes intégrations et applications regorgeant de possibilités.
Posté aussi sur :
Ebsi2.0

Les moteurs de recherches visuels

Voici une liste quasi exhaustive de ce qui se fait en matière de moteurs de recherche actuellement en ligne :
- Search Me : en période de test
- Xcavator : moteur de recherche d'images dont les résultats sont des images sous forme de mosaïque
- ManageQ : sa particularité est de trier les résultats selon qu'ils s'apparentent à une personne, une chose ou un endroit.
- la suite demain

la visualisation des résultats de requête : quelles sont les issues ?

Je suis arrivée à la conclusion suivante :
La recherche d'information est un processus engendrant de multiples sous-processus cognitifs chez l'utilisateur. De nombreuses recherches ont permis de faire le portrait de l'utilisateur dans l'activité de recherche (ISP de Kuhlthau), dans son environnement de recherche (le comportement informationnel de Wilson et Case), et enfin par rapport à ses capacités à user de la technologies (concept de network competence, style cognitifs, et stratégies de recherche).
Il s'avère que les problématiques auxquelles l'utilisateur est confronté se manifestent lorsqu'il procède concrètement à sa recherche sur le système. Les principales problématiques sont : la surcharge cognitive et l'anxiété. Les facteurs identifiés sont : la difficulté de définir le besoin informationnel, et de le formuler avec les termes appropriés, la déficience de l'interface en matière de communication homme-machine, la désorientation observée sur le système et dans le déroulement de la tâche. La page des résultats de requêtes est apparue déterminante et manquant de nombreuses fonctionnalités d'interaction dans la mesure où si l'utilisateur ne trouve pas satisfaction parmi la liste de résultats, il n'y a guère de système utilisant la page de résultats pour faire part de suggestion aidant à la recherche de l'utilisateur, excepté peut être des corrections orthographiques de requête.
Les apports de la visualisation semblent en théorie répondre avantageusement à chacun de ses enjeux que représente la recherche d'information pour un système d'information. Optimisant la cognition par l'usage de la sémiologie graphique et de techniques d'interaction favorisant la communication homme-machine, les problèmes de surcharge cognitive et d'absence d'intuitivité de l'interface devaient être améliorés. Malheureusement, dans les faits les systèmes proposant de visualiser l'information ne sont pas révolutionnaires. Les évaluations de ces systèmes le prouvent, ainsi que leur faible popularité par rapport au système traditionnel.
Cependant, il faut prendre en compte que l'évaluation des systèmes n'est pas encore assermentée par un cadre théorique. Il y a des initiatives scientifiques qui travaillent sur le sujet : TREC. Il semble au regard des suggestions de nos auteurs qu'une évaluation qualitative soit privilégiée, basée sur le comportement informationnel.
Enfin, il est nécessaire de consolider le cadre théorique de la visualisation de l'information, si on veut pouvoir apporter des éléments de réponse aux questions suivantes :
La VI est-elle opportune dans le processus de recherche d’information?
Quelle organisation de l’information est adéquate pour autoriser son évaluation par l’utilisateur, mais aussi pour faciliter les réorientations de recherche le cas échéant?
Quels sont les paradigmes sémantiques de cette organisation? Comment représenter graphiquement cette organisation d’information?

wikia search un nouveau moteur de recherche - test

Le co-fondateur de wikipedia lance enfin wikia search en ligne. La version est non pas encore bêta, mais alpha, n'allons pas trop vite en besogne. Première déception : il n'y a aucune interface proposant une visualisation des résultats de recherche. Ce n'était pas un but affiché. Donc ça aurait été une bonne surprise.
Visuellement :
WikiA search est donc un engin de recherche qui se constitue d'une interface plus ou moins épurée. En effet, l'interface de recherche affiche des images qui doivent sans doute la rendre plus "user friendly". Ça a sans doute vocation à à agir sur notre affect par rapport à cette interface.
Les résultats de recherche sont affichés sous forme de liste et il y aurait (mais ca n'a pas l'air encore implémenté) possibilité de noter les résultats, si on fait attention aux 5 étoiles qui sont pour l'instant transparentes.
Techniquement :
C'est un free software. Il est en effet publié sous GNU General Public Licence.
L'interface de recherche est comme celle habituelle : une textbox (un boite dans laquelle on peut entrer du texte, sa requête).
Les résultats de recherche sont ordonnés selon un principe de pertinence, lequel est un algorythme comme pour Google. Ce qu'il y a d'intéressant c'est qu'on peut consulter comment le calcul s'est effectué pour chacun des résultats en cliquant sur le nombre en dessous du résultat. exemple de score décrypté.
La grande nouveauté par rapport à un engin de recherche habituel est que , si on s'inscrit comme utilisateur, on peut contribuer avec nos propres contenus. Lorsqu'on effectue une recherche comme par exemple "information visualization", les résultats s'affichent, et en premier lieu, il est proposé d'alimenter les résultats par un mini article de notre cru. Une interface d'édition est alors proposée comme dans un wiki. On y écrit sa proposition, son "mini article" et celui-ci est visible par les autres utilisateurs lors de requêtes effectuées sur le même sujet. Ce mini article peut être discuté.
Je serai intéressée par d'éventuels retours d'utilisation.

Pour des informations supplémentaires sur les conditions du lancement et sur le projet lui-même je vous invite à consulter ces pages:
Références
Le(s) site(s) officiel(s)
interface de recherche
wikia
le projet wikia, moteur de recherche
l'entreprise qui gère wikiA

Videos
Wales talks Wikia Search

La presse
Wikia, Jimmy Wales Unveil First Public Alpha of Open Source Search Project - Reuters
Wikia Wants to Shake Up Search - Business Week
Wikia search engine goes head-to-head with Google - Financial Post
Wikia Search Project to Launch Jan. 7, Wales says - Washington Post

Receptions sur les sites "techno"
http://www.journaldunet.com/0612/061228-wikiasari.shtml - Journal du Net
Wikia Search Is A Complete Letdown - Techcrunch
January 6 2008 - Wikia Search Goes Live: Not Great - Techcrunch
January 7, 2008 Wikia Search Requires Your Help - SearchEngineWatch.com
Wikia launching human-powered search - Cnet

le desordre du web // Page Rank

Dans la page intitulée "Pourquoi Google", Google SA explicite son but premier à savoir remédier au phénomène d'entropie:
"Google, la fin du chaos !
Google maîtrise l'information en proposant un nouveau type de recherche : non pas un annuaire à portée limitée ni une liste de résultats adjugés à la plus forte enchère, mais une solution ingénieuse et efficace qui organise le Web en tenant compte de sa structure vaste et démocratique."

L'entropie est une notion assez complexe. J'aime assez cependant l'article de Wikipedia (en français) :
"Intuitivement, l'entropie de Shannon peut être vue comme mesurant la quantité d'incertitude liée à un évènement aléatoire, ou plus précisément à sa distribution. Une autre manière de voir est de parler de la quantité d'information portée par le signal: l'information fournie par chaque nouvel évènement est fonction de l'incertitude sur cet évènement.[...]
Prenons un autre exemple: considérons un texte en français codé comme une chaîne de lettres, d'espaces et de ponctuations (notre signal est donc une chaîne de caractères). Comme la fréquence de certains caractères n'est pas très importante (ex : 'z'), tandis que d'autres sont très communs (ex : 'e'), la chaîne de caractères n'est pas si aléatoire que ça. D'un autre côté, tant qu'on ne peut pas prédire quel est le caractère suivant, d'une certaine manière, cette chaîne est aléatoire. L'entropie est une mesure de cet aléatoire suggérée par Shannon dans son article de 1948"
.
Réduire le phénomène d'entropie signifie en quelque sorte procéder à une désambiguisation de l'information, il faut pouvoir distinguer les informations, et pas chercher au sein d'une masse informe, ce qui accroît la notion d'incertitude.
L'incertitude est en effet un élément clef dans le processus de recherche d'information. Carol Kuhltau (KUHLTAU, 1991) dans son article "inside the search process" explique que le degré d'incertitude est un facteur déterminant l'issue de la recherche.
Il est donc tout à fait louable que les outils de recherche prennent en charge une partie du travail de désambiguisation, surtout face à la masse d'information rendue accessible via Internet.
Le Page Rank est un algoritme qui a le mérite de considérer l'architecture hypertextuelle du Web non seulement en suivant les liens mais aussi en considérant la récursivité de ses liens. C'est à dire que les références sont pondérées en fonction des liens sortants et entrants.

Schéma du principe du Page-Rank

La recursivité et la réciprocité sont des éléments qui peuvent se rapprocher de l'évaluation scientifique effectuée par les pairs : un article d'un scientifique est évalué par ses pairs. Parallèlement si une page réfère à d'autres pages et que ces dernières et d'autres réfèrent à la première, les liens sont plus "solides", "valables" et on y accorde donc plus de poids et de pertinence.

Pour en savoir plus :
le brevet du Page Rank
Brin, Sergey, Page, Lawrence. 1999. The Anatomy of large-scale hypertextual web search engine. Computer systems and ISDN Systems 30, 1-7, 107-117. [En ligne] The anatomy of large-scale hypertextual web search engine
Eisermann, Michaël. Comment fonctionne Google , cours MAT249, Mathématiques assistées par ordinateur [en ligne] dernière mise à jour 2 avril 2007.
Leclerc, Aurélien. 2006. Rapport VA sur "Page Rank : le référencement de sites" dans le cadre d'un travail de l'École Centrale d'Électronique.
Kuhlthau, Carol. 1991 Inside the search process: information seeking from the user’s perspective. Journal of the American Society for Information Science 42, 5, 361-371

Anymails - épisode 1 "visualisation de l'information"

Anymails ou ajouter un semblant de vie dans une boîte e-mail.

Cette application a été réalisée par Carolin Horn. Le sujet de sa thèse était : “Natural Metaphor For Information Visuzalization”.
Anymails est une manière de visualiser l'état de sa boîte par le biais de métaphores naturelles.
"I have investigated how I can use natural metaphors to visualize my inbox, its structure and attributes. The metaphor of microbes is used. My objective is to offer the user another experience of his email world." Carolin Horn

Le dispositif de visualisation se concentre sur la représentation de ces caractéristiques : la catégorie des expéditeurs, le cycle de vie des e-mails (non-lus, lus, répondus), la date de réception des e-mails.

Anymails - Visualization of my email inbox

Le système de visualisation résume ainsi les informations visualisées :
la forme et la couleur = une catégorie d'expéditeur
la vitesse d'animation = statut de lecture/réponse du e-mail
la règle numérotée en bas = période de temps

En action, un petit film de Carolin Horn qui illustre l'utilisation.

Ce projet me semble intéressant par le fait qu'il exploite l'aspect "vivant" de la métaphore du naturel pour des e-mails, qui ne sont "vivants" que par leur statut lu/non lu/répondu dans une boîte e-mail habituelle.
Il propose une vision sur échelle de temps. Il est possible de déterminer une période, et visualiser les e-mails reçus à cette période
Point négatif :
Le fait est que la seule manière de les distinguer au niveau de leur contenu, c'est la nature (pas le nom!) de l'expéditeur...encore moins l'objet des e-mails. Pour une boîte d'e-mails, le dispositif de repérage de contenu n'est pas du tout optimisé.
Point positif :
Par contre, ça a l'avantage de donner un aperçu qui donne tout de suite l'état de notre boîte par rapport au statut "vivant" des e-mails.
Ce dispositif permet de visualiser une grande masse d'e-mails.
Une interrogation ?
Comment interpréter le déplacement des "bêbêtes" e-mail dans la boîte? Sont-ce des déplacements significatifs ou aléatoires ?

En tout cas ce genre de visualisation réveille les appétits des insectivores...

visualisation de l'information - préambule

Chaque semaine je vais présenter un type de visualisation et tenter de commenter l'adéquation du propos à la forme visuelle adoptée.
Je prends comme sources de référence :
- the periodic table of visualization methods
- information aestetics
- information architects/notebook
- knowledge-mapping.net
- les écrans de libération.fr
et bien entendu, le livre d'Edward Tufte, Envisioning Information.