Archive pour le mot-clef ‘semantic web’

Dynamique des débats 2.0

Mardi 13 avril 2010

Ma dernière présentation sur les débats web.

Je positionne mes travaux dans un contexte web-social-sémantique. La présentation était accompagnée d’une démo d’un ensemble de portlets permettant de faire des annotations discursives et sémantiques.

utilisation d’un vocabulaire RDF - le cas de FOAF

Lundi 28 décembre 2009

Je commence une série de tutoriels axés web sémantique. Dans le cadre de mes travaux je dois utiliser des vocabulaires RDF-OWL pour représenter des données et les échanger entre des applications.

Du coup, je me suis dit en voyant le peu de tutoriels en français sur le web que ça vaudrait le coup d’en faire un moi-même.

Ce premier tutoriel concerne l’utilisation d’un vocabulaire existant. En particulier le vocabulaire FOAF qui permet de décrire des personnes et le réseau de connaissances de ces personnes.

Nous allons dans ce premier tutoriel utiliser une syntaxe RDF/XML. Ce n’est pas la seule solution possible mais c’est celle qui m’a semblé “la plus propre”, la plus simple à lire par un humain. Je reviendrai peut-être dans d’autres tutoriels sur d’autres syntaxes.

Le mieux étant de s’appuyer sur l’usage, je vais m’appuyer sur la construction du RDF FOAF permettant de me décrire.

Début du document

Un document RDF/XML est avant tout un document XML. Donc vous pouvez déclarer la version d’xml utilisée et l’encodage :

<?xml version =”1.0″ encoding =”utf-8″?>

Vous pouvez aussi lui associer un style.

Ensuite, vous allez devoir dans votre RDF faire référence aux vocabulaires existants que vous utilisez. Par exemple, FOAF est défini à l’url http://xmlns.com/foaf/0.1/

A chaque fois que vous allez utiliser une classe de FOAF, vous allez devoir taper http://xmlns.com/foaf/0.1/:ClasseAUtiliser

Mais heureusement vous pouvez déclarer au début de votre RDF que vous allez utiliser ce vocabulaire et lui associer un alias. Cette déclaration peut se faire dans la balise <rdf:RDF> signalant le début de votre document RDF. Mais notez que vous pouvez déclarer un alias pour un vocabulaire dans n’importe quel noeud. L’alias n’étant alors valable que pour les noeuds fils.

Exemple pour FOAF en début de document :

<rdf:RDF xmlns:foaf=”http://xmlns.com/foaf/0.1/”>

On a associé l’alias foaf au vocabulaire défini à l’url http://xmlns.com/foaf/0.1/

On aura aussi besoin de quelques éléments du vocabulaire RDF de base donc le début de document devient :

<rdf:RDF xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#” xmlns:rdfs=”http://www.w3.org/2000/01/rdf-schema#” xmlns:foaf=”http://xmlns.com/foaf/0.1/”>

Nous ajouterons d’autres vocabulaires par la suite dans ce tutoriel. Mais je ne reviendrai pas sur la déclaration des alias.

Principes de RDF

Avant de nous intéresser au corps du document, nous allons faire un petit rappel sur le principe de base de RDF.

RDF permet d’écrire des triplets Sujet Prédicat Objet.

Un sujet, un prédicat et un objet sont des ressources identifiées par des URI. Une URI étant censée être unique pour une ressource. Par exemple, une URL est une URI.

Afin de permettre de réifier un triplet en concept, il est possible d’associer une URI à un triplet. Ces triplets réifiés sont appelés des Statement.

Les Objets et Sujets sont des instances de classes RDF. Les prédicats sont des propriétés RDF. Dans les spécifications, pour chaque propriété est précisé son Domaine (le type ou la classe du Sujet) et son Range (le type ou la classe de l’Objet).

Corps du document

Nous allons dans ce document décrire ma personne Natoine. Nous allons utiliser la classe foaf:Person. Le début de la déclaration :

<foaf:Person rdf:about=”http://www.natoine.fr/#me”>
  • foaf:Person, je fais une instance de Person.
  • rdf:about=”http://www.natoine.fr/#me” , je précise l’URI de la ressource. En l’occurence j’utilise une URL existante, la page d’accueil de mon domaine à laquelle je concaténe #me. Il existe d’autres façons de faire référence à une ressource. Par exemple, au lieu de rdf:about on peut utiliser rdf:ID. Dans ce cas, la valeur prise est concaténée à l’URL du document pour constituer l’URI ou bien concaténée à une URI précisée par xml:base. Par exemple :
<rdf:RDF xmlns:foaf=”http://xmlns.com/foaf/0.1/” xml:base=”http://www.natoine.fr”>

<foaf:Person rdf:ID=”me”>

</foaf:Person>

</rdf:RDF>

On parle toujours de la personne identifiée par l’URI http://www.natoine.fr/#me. rdf:ID ajoute un #. Notez aussi que rdf:about=”#me” serait totalement équivalent. Si rdf:about ne précise pas une URI compléte, celle-ci est construite par concaténation.

Foaf Basics

Maintenant que peut-on dire sur ma personne?  FOAF définit un ensemble de propriétés. Je ne vais pas toutes les détailler. Il suffit d’aller regarder les spécifications de FOAF.

Mais pour l’exemple je vais préciser mon nom, prénom, surnom,… En gros les Basics de FOAF. Que du très simple pour l’instant. On utilise des Strings ou des références à des ressources web.

<foaf:Person rdf:about=”http://www.natoine.fr/#me”>
<!– FOAF Basics –>
<foaf:name xml:lang=”fr”>Antoine Seilles</foaf:name>
<foaf:nick>Natoine</foaf:nick>
<foaf:surname>Natoine</foaf:surname>
<foaf:familyName>Seilles</foaf:familyName>
<foaf:firstName>Antoine</foaf:firstName>
<foaf:title>phD Student</foaf:title>
<foaf:homepage rdf:resource=”http://www.natoine.fr/”/>
<foaf:img rdf:resource=”/natoine.ico”/>
<foaf:depiction rdf:resource=”/natoine.ico”/>
<foaf:depiction rdf:resource=”http://www.imagilab.fr/wp-content/gallery/RiviereTournage/01.JPG”/>
<foaf:depiction rdf:resource=”http://www.imagilab.fr/wp-content/gallery/RiviereTournage/02.JPG”/>
<foaf:depiction rdf:resource=”http://www.imagilab.fr/wp-content/gallery/RiviereTournage/07.JPG”/>
<foaf:depiction rdf:resource=”http://www.imagilab.fr/wp-content/gallery/RiviereTournage/08.JPG”/>
<foaf:depiction rdf:resource=”http://www.imagilab.fr/wp-content/gallery/RiviereTournage/13.JPG”/>
<foaf:depiction rdf:resource=”http://www.imagilab.fr/wp-content/gallery/RiviereTournage/18.JPG”/>
<foaf:depiction rdf:resource=”http://www.imagilab.fr/wp-content/gallery/RiviereTournage/19.JPG”/>
<foaf:depiction rdf:resource=”http://www.imagilab.fr/wp-content/gallery/RiviereTournage/20.JPG”/>
</foaf:Person>

Notez l’utilisation de rdf:resource pour faire référence à des ressources existantes. Il est possible de faire des références absolues, ou relatives (celles-ci obéissent aux mêmes règles que rdf:ID).

Pour des ressources présentes sur internet, vous pouvez vous contenter de préciser l’URL. Mais je vous encourage à en dire un peu plus quand c’est possible. Par exemple pour des images, il est possible d’utiliser la classe foaf:Image. Je détaille l’utilisation de foaf:Image un peu plus loin dans ce tutoriel.

Foaf Personal Info

Attaquons-nous maintenant aux informations personnelles (Personal Info), tout en restant sur des ressources internet ou des String.

Voilà ce que je rajoute comme infos me concernant :

<!– FOAF Personal Info –>
<foaf:weblog rdf:resource=”/wordpress”/>
<foaf:currentProject rdf:resource=”http://www.imagilab.fr”/>
<foaf:currentProject rdf:resource=”http://www.blackpad.fr”/>
<foaf:currentProject rdf:resource=”http://intermed.csregistry.org/tiki-index.php”/>
<foaf:workplaceHomepage rdf:resource=”http://www.lirmm.fr/”/>
<foaf:workInfoHomepage rdf:resource=”http://www.lirmm.fr/”/>
<foaf:schoolHomepage rdf:resource=”http://lycee-pompidou-34.org/”/>
<foaf:schoolHomepage rdf:resource=”http://www.univ-montp2.fr/”/>
<foaf:publications rdf:resource=”/publications”/>

Venons-en maintenant aux centres d’intèrets. L’un de mes centres d’interêt est l’Intelligence Artificielle. Dans les spécifications de FOAF, il est dit que la propriété interst a pour range un foaf:Document.

Une syntaxe minimale pour dire que je suis intéressé par l’intelligence artificielle serait :

<foaf:interest rdf:resource=”http://fr.wikipedia.org/wiki/Intelligence_artificielle”/>

Mais on peut faire mieux grâce à la classe foaf:Document :

<foaf:interest>

<foaf:Document rdf:about=”http://fr.wikipedia.org/wiki/Intelligence_artificielle”/>

</foaf:interest>

Cependant on peut avoir envie d’en dire un peu plus au sujet de ce centre d’intérêt que de faire référence à une page wikipedia. Pour l’exemple, on va dire que la page en question a pour titre Intelligence Artificielle, qu’elle est la page française de wikipedia au sujet de l’intelligence artificielle.

On va utiliser les propriétés title et description du vocabulaire Dublin Core et la propriété foaf:topic de FOAF.

Il faut ajouter l’alias à dublin core : xmlns:dc=”http://purl.org/dc/elements/1.1/”

et notre foaf interest devient :

<foaf:interest>
<foaf:Document rdf:about=”http://fr.wikipedia.org/wiki/Intelligence_artificielle”>
<dc:title>Intelligence Artificielle</dc:title>
<dc:description>French Artificial Intelligence page on wikipedia</dc:description>
<foaf:topic>Artificial Intelligence</foaf:topic>
</foaf:Document>
</foaf:interest>

De la même façon on peut donner plus d’information sur les foaf:Image utilisées comme foaf:depiction. Par exemple, j’ai enrichi les infos concernant mes photos de la façon suivante :

<foaf:depiction>
<foaf:Image rdf:about=”http://www.imagilab.fr/wp-content/gallery/RiviereTournage/01.JPG”>
<dc:title>Antoine et Erik</dc:title>
<dc:description>Picture of Natoine and Erik during “La riviere” shooting</dc:description>
<dc:format>image/jpg</dc:format>
<foaf:maker rdf:resource=”http://www.vincentrok.com/”/>
</foaf:Image>
</foaf:depiction>

J’utilise à la fois le vocabulaire Dublin Core et le vocabulaire FOAF. La propriété foaf:maker est équivalente à la propriété Dublin Core dc:creator. Elle permet de préciser qui est l’auteur d’une ressource. En l’occurence, les photos sont prises par Vincent Rok.

foaf:maker est censé être une foaf:Person. Donc comme toujours, je peux me contenter d’une URL ou je peux créer une foaf:Person. Ce qui donne à minima:

<foaf:maker>
<foaf:Person rdf:about=”http://www.vincentrok.com/”/>
</foaf:maker>

Cependant, il se trouve que je connais Vincent Rok et donc je déclarerai Vincent Rok comme une personne quand je déclarerai mes connaissances. Du coup je peux me contenter de la ligne <foaf:maker rdf:resource=”http://www.vincentrok.com”/> .

Lien à DBPedia

Bien sûr on pourrait faire encore mieux. Surtout qu’un topic foaf est “A thing” (la super classe) pour RDF. Du coup on pourrait faire de topic n’importe quoi d’autre, comme un tag par exemple, ou une discipline. Mais il faudrait s’appuyer sur un autre vocabulaire. Gardez en tête que une URL est souvent la meilleure information à donner. Surtout si par cette URL on peut à nouveau récupérer du RDF. Pensez à DBPedia par exemple. Au lieu de décrire dans mon profil ce qu’est mon centre d’intérêt en utilisant le vocabulaire de Dublin Core, je pourrai mettre une url à laquelle on trouvera une description de ce centre d’intérêt.

Un autre de mes centres d’intérêt est la Réalité virtuelle. Il existe une page Wikipedia française et un équivalent anglais. Je pourrai faire un simple lien vers l’une de ces deux URL ou, un peu mieux, mettre l’une de ces URL comme Document avec un petit peu d’informations supplémentaires. Sauf qu’il y a encore mieux: DBpedia permet pour chaque page de Wikipedia version anglaise de récupérer un RDF décrivant cette ressource.

L’URL Wikipedia de la réalité virtuelle en anglais est : http://en.wikipedia.org/wiki/Virtual_reality

Du coup, il existe une page DBpedia : http://dbpedia.org/page/Virtual_reality

Et pour récupérer le RDF/xml l’url est : http://dbpedia.org/data/Virtual_reality.rdf

Ce qui donne dans mon RDF :

<foaf:interest rdf:resource=”http://dbpedia.org/data/Virtual_reality.rdf”/>

Si vous allez regarder le contenu de ce RDF, vous verrez qu’il y a des infos super pratique comme l’utilisation de owl:sameAs qui permet de dire que cette ressource est la même que d’autres ressources, et puis surtout l’utilisation de foaf:page et foaf:depiction. Donc DBpedia réutilise des vocabulaires existant comme le vocabulaire FOAF.

Déclarez vos connaissances

Ensuite, viennent les “connaissances”, ces personnes que je connais. FOAF ne permet que de déclarer des connaissances grâce à la propriété knows.

Je vais déclarer que je connais Vincent Rok le photographe et Julien Cotret mon collégue de bureau.

<foaf:knows>
<foaf:Person rdf:about=”http://www.vincentrok.com/”>
<foaf:nick>Vincent Rok</foaf:nick>
<foaf:homepage rdf:resource=”http://www.vincentrok.com/”/>
<foaf:gender>male</foaf:gender>
<foaf:currentProject rdf:resource=”http://www.imagilab.fr”/>
</foaf:Person>
</foaf:knows>
<foaf:knows>
<foaf:Person rdf:about=”http://www.natoine.fr/#Julien_Cotret”>
<foaf:name xml:lang=”fr”>Julien Cotret</foaf:name>
<foaf:familyName>Cotret</foaf:familyName>
<foaf:firstName>Julien</foaf:firstName>
<foaf:title>phD Student</foaf:title>
<foaf:gender>male</foaf:gender>
<foaf:currentProject rdf:resource=”http://intermed.csregistry.org/tiki-index.php”/>
</foaf:Person>
</foaf:knows>

Mais je ne connais pas Julien de la même façon que je connais Vincent. Et Foaf ne me permet pas d’en dire plus sur ces relations. Cependant, il est possible d’étendre FOAF (comme tout autre vocabulaire) et de définir des relations plus spécifiques.

Enrichissement d’un vocabulaire

Par exemple nous allons définir une relation de collégue de travail.

Cette tâche demande que l’on crée un rdf de description du vocabulaire enrichi puis qu’on ajoute un alias à ce vocabulaire.

Appelons notre nouveau vocabulaire totoFoaf.

<rdf:RDF
xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”
xmlns:rdfs=”http://www.w3.org/2000/01/rdf-schema#”
xmlns:foaf=”http://xmlns.com/foaf/0.1/”
xmlns:dc=”http://purl.org/dc/elements/1.1/”
xml:base=”http://www.natoine.fr/totoFoaf.rdf”>

<rdf:Description rdf:about=”">
<dc:author rdf:resource=”"/>
<dc:title>Sample Relationships Schema</dc:title>
<dc:description>Schema for Defining Relationships in FOAF</dc:description>
</rdf:Description>

<!–property–>

<rdf:Description rdf:about=”http://www.natoine.fr/totoFoaf.rdf/Colleague”>
<rdf:type rdf:resource=”http://www.w3.org/1999/02/22-rdf-syntax-ns#Property”/>
<rdfs:subPropertyOf rdf:resource=”http://xmlns.com/foaf/0.1/knows”/>
<rdfs:label>Colleague</rdfs:label>
</rdf:Description>
</rdf:RDF>

Du coup en modifiant mon rdf on peut dire que Julien Cotret est un collégue de travail.

<totoFoaf:colleague>
<foaf:Person rdf:about=”http://www.natoine.fr/#Julien_Cotret”>
<foaf:name xml:lang=”fr”>Julien Cotret</foaf:name>
<foaf:familyName>Cotret</foaf:familyName>
<foaf:firstName>Julien</foaf:firstName>
<foaf:title>phD Student</foaf:title>
<foaf:gender>male</foaf:gender>
<foaf:currentProject rdf:resource=”http://intermed.csregistry.org/tiki-index.php”/>
</foaf:Person>
</totoFoaf:colleague>

Mes comptes sur le web

Il reste un dernier point. L’une des problèmatiques du web actuel avec la prolifération des applications de social networking est l’identité fragmentée des utilisateurs. Etant utilisateur de Facebook, de twitter, d’un blog, de plusieurs forums, je me retrouve avec autant de comptes utilisateurs différent que d’applications web que j’utilise. Du coup, j’ai envie de dire que tout ces comptes me sont associés. Il est possible de le faire grâce à la propriété foaf:account.

Par exemple je déclare mon compte twitter :

<foaf:account>
<foaf:OnlineAccount>
<foaf:accountServiceHomepage rdf:resource=”http://www.twitter.com”/>
<foaf:accountName>natoine</foaf:accountName>
</foaf:OnlineAccount>
</foaf:account>

Pour conclure ce turoriel, vous trouverez mon FOAF complet en ligne. Vous pouvez l’explorer avec FOAF explorer qui permet d’explorer de proches en proches le réseau. Et essentiel pour tester votre RDF/XML, il existe un validateur w3C.

Collectivités 2.0

Lundi 21 décembre 2009

Après avoir parlé d’Entreprise 2.0 , venons-en à ce qui m’intéresse vraiment dans le cadre de ma thèse : la Démocratie 2.0.
Enfin presque, on va d’abord parler ici de Collectivité 2.0.

Commençons par définir ce qu’est la Collectivité 2.0 :
Que trouve-t-on sur google?
On trouve le site de la société Client au coeur qui dit :
Une « collectivité 2.0 » utilise les nouvelles technologies Internet pour permettre une participation plus forte des citoyens à la vie locale. Ces technologies numériques facilitent la construction sociale du territoire : elles privilégient la collaboration et l’auto-organisation.

Personnellement je pense que c’est une erreur que de commencer par parler de citoyens et de territoire sans avoir au préalable dit ce qu’était une collectivité. De façon encore plus naïve, on aurait pu dire en s’inspirant de la définition de l’Entreprise 2.0 :
La Collectivité 2.0 est l’utilisation émergente de plateformes d’applications sociales au sein de collectivité, ou entre des collectivités et leurs interlocuteurs.

Donc il faut commencer par bien définir ce que l’on entend par Collectivité.

L’article 72 de la constitution française :

Les collectivités territoriales de la République sont les communes, les départements, les régions, les collectivités à statut particulier et les collectivités d’outre-mer régies par l’article 74. Toute autre collectivité territoriale est créée par la loi, le cas échéant en lieu et place d’une ou de plusieurs collectivités mentionnées au présent alinéa.
Les collectivités territoriales ont vocation à prendre les décisions pour l’ensemble des compétences qui peuvent le mieux être mises en œuvre à leur échelon.
Dans les conditions prévues par la loi, ces collectivités s’administrent librement par des conseils élus et disposent d’un pouvoir réglementaire pour l’exercice de leurs compétences. [...]

On parle donc de collectivités territoriales. Donc Client au coeur a raison de parler de territoire dans sa définition. Il est même dit “construction sociale du territoire”. Si l’on parle de Collectivité 2.0, c’est bien que l’on se demande ce que les technologies du web2.0 vont pouvoir améliorer dans le travail des collectivités territoriales, donc que l’on prend en compte l’aspect social.

Le travail d’une collectivité territoriale c’est quoi?

Il me semble que le travail d’une collectivité territoriale est d’améliorer les conditions de vie des citoyens d’un territoire (je suis sûrement naïf). Cela passe donc par l’aménagement du territoire, par une mise en place de services aux citoyens. Il y a des enjeux économiques, une dimension sociale, une dimension spatiale. Sur Wikipedia, on trouve à aménagement du territoire tout un ensemble de secteurs d’intervention :

  • le développement économique
  • les politiques sociales spatialisées
  • les politiques du logement
  • le développement des infrastructures
  • la disponibilité des ressources en eau et leur gestion intégrée afin d’assurer leur durabilité
  • la préservation et la mise en valeur de l’environnement comme on la conçoit par exemple dans la gestion intégrée des zones côtières

Dans le même article, on trouve aussi que l’objectif des collectivités territoriales est le suivant :

l’accompagnement du développement économique (donc oui je suis naïf), et la réduction des inégalités spatiales en termes économiques ou sociaux.

Au final, faut-il vraiment voir l’institution “collectivité territoriale” comme au service du citoyen? Une collectivité territoriale est toujours dirigée par un ou plusieues élu(s). Il ne faut donc pas perdre de vue que les actions de la collectivité sont toujours liées aux décisions politiques de ses élus.

Quels sont les moyens d’action des collectivités territoriales? Il n’y a pas de pouvoir législatif. Par contre elles ont un pouvoir règlementaire au niveau de l’urbanisme (elles construisent et subventionnent en fixant des règles). Elles font, construisent, mettent en place des services en utilisant les moyens financiers que leurs procurent la fiscalité locale et les dotations financières de l’Etat. Elles disposent de pouvoirs de police en matière de gestion d’espaces publics, de droit social , et de réglementation sur l’urbanisme (gestion de l’espace, environnement, ou de prestations privée ou publiques à certains publics tels les transports, les tarifs de maisons de retraite ou autres services publics).

Dans l’ensemble de ces actes, la communication avec le public est forte, allant dans certains cas de la simple information à de la concertation-participation voire des démarches de sensibilisation et jusqu’à de la formation ou de l’éducation.

Ce qu’il faut retenir donc c’est que l’institution collectivité territoriale (une mairie, un conseil général ou régional,…) est d’un côté à l’écoute des citoyens et de l’autre fortement guidée par la politique d’un ou plusieurs élu(s). Donc son véritable rôle est de faire le lien entre les citoyens et la politique pratiquée. Il y a donc un travail de concertation et aussi un travail de communication et d’information (de sensibilisation). Il faut savoir ce qu’attendent les citoyens et leur communiquer ce que fait la politique et en quoi cela les concerne. Les sensibiliser, c’est aussi leur demander d’adhérer à une action collective qui va ne porter ses fruits que par l’addition des bons comportements individuels (exemple du tri collectif des déchets).

Dans Collectivité 2.0 comme dans Entreprise 2.0, il y a cette idée d’émergence de pratiques web. Donc les outils Collectivité 2.0 ne doivent pas être imposés par l’institution mais bien proposés et adoptés par les utilisateurs. Un blog ou un wiki citoyen sont “Collectivité 2.0″. Ce côté émergent est très gênant pour l’institution. Elle n’a pas le contrôle de ce qui est dit. Contrôle au sens de l’image qui est véhiculée mais aussi l’accès au contenu, à l’information. N’importe qui peut monter son blog parlant de la vie dans sa région. Et n’importe qui peut se faire le porteur d’une demande que la collectivité risque de ne pas pouvoir satisfaire et risque même de ne pas avoir décelée.

Mais heureusement pour l’institution, il lui reste des moyens d’agir. Pour commencer, une institution territoriale se doit d’avoir un portail web. Un site qui lui serve de vitrine, qui lui permette de communiquer (au sens présenter de l’information). Là ou interviennent les technologies web2.0, c’est que ce portail web ne doit pas être uniquement une vitrine. Il faut que l’institution soit à l’initiative de l’expression d’une demande ou qu’elle soit avertie de cette demande dés le début de la réflexion. Et c’est là le plus gros enjeu de son site web.

Dans l’Entreprise 2.0, les objectifs sont l’amélioration de la communication à l’intérieur de l’entreprise et l’amélioration de la veille et la capitalisation des connaissances.

Dans la Collectivité 2.0, les objectifs sont l’amélioration de la communication à l’intérieur de la collectivité (donc entre les citoyens, l’institution et les élus) et l’identification des acteurs.

L’institution ne peut pas être maîtresse de tous les outils de la Collectivité 2.0. Mais elle reste maîtresse de son propre site, son portail. A elle de faire en sorte que celui-ci soit au centre de la Collectivité 2.0. Je pense qu’il n’y a rien de pire qu’un site institutionnel qui n’a aucun recueil d’avis et qui se retrouve dépassé par le blog d’un tiers. Dans ce cas, l’institution n’entendra sûrement jamais ces avis, et donc les élus non plus…

Quels sont les apports attendus des outils web2.0?

On part donc du principe que le site au coeur de la Collectivité 2.0 est celui d’une institution représentant une collectivité territoriale. Au coeur ne signifie pas que ce site doit être le plus visible nécessairement. Au coeur signifie que ce site permettra de relayer toute l’activité de la Collectivité 2.0, aggréger cette activité et lui donner une visibilité. Pour moi, cela veut dire que ce site doit répondre au paradigme SLATES de Andrew McAfee. Bien que je présente SLATES dans l’article Entreprise2.0, je reviens sur celui-ci afin de l’expliciter dans le contexte des collectivités.

SLATES pour le site institutionnel d’une collectivité:

  • Search : l’utilisateur doit pouvoir trouver toute l’information qu’il cherche. Que cette information soit générée par l’institution ou qu’elle provienne d’un autre acteur sur un autre site.
  • Links : l’utilisateur doit pouvoir lier les informations. En particulier si les informations ne proviennent pas du site institutionnel, il doit pouvoir signaler et référencer cette information dans le site institutionnel.
  • Authoring : l’utilisateur doit pouvoir émettre son avis, faire partager son expérience au sein du site institutionnel même s’il peut le faire par ailleurs. Ceci est de prime importance dans le travail d’identification des acteurs.
  • Tags : l’utilisateur doit pouvoir participer au travail de catégorisation des informations. Les tags permettent cette catégorisation et permettent de garder une trace du passage de l’utilisateur.
  • Extensions : le site institutionnel doit pouvoir recommander des lectures à ses visiteurs, des lectures provenant du site institutionnel ou non.
  • Signals : le site doit permettre à chacun de suivre l’évolution de l’activité de la collectivité 2.0 (modifications du site institutionnel, modifications d’autres sites de la collectivité2.0, visibilité du planning événementiel,…).

Quelles sont les solutions?

Toute la difficulté est de concilier les besoins, les solutions, la simplicité d’usage et les problèmes de confidentialité.

Le premier besoin est celui de la communication. De base, il faut que les supports de communication soient bien conçus. Donc il faut travailler avec des experts et des professionnels de la communication pour bien présenter son discours. Mais surtout, d’un point de vue web2.0, il faut être capable de mesurer l’impact de cette communication (afin le cas échéant de modifier la stratégie de communication). Pour mesurer l’impact il faut se doter d’indicateurs (selon l’impact d’ailleurs). Ces indicateurs peuvent aller des simples données de fréquentation (visite de la page, nombre de téléchargement,…) à des données plus qualitatives comme la possibilité de laisser un avis. N’oublions pas qu’un service sur le web peut être vu comme étant donnant-donnant. L’utilisateur profite d’un service mais peut laisser des données pour améliorer ce service. Il est toujours possible de demander à ce que l’utilisateur remplisse une page de profil ou un formulaire d’enquête de satisfaction afin d’avoir le droit d’accéder à une certaine information. C’est là qu’il faut penser simplicité d’usage. Plus l’utilisateur devra déclarer d’informations plus il sera rebuté par l’utilisation du service. C’est aussi ici que se posent les questions de confidentialité. Il faut bien que ces informations soient utilisées à des fins légitimes et non conservées dans un objectif de fichage.

Ces idées de profil et d’enquêtes de satisfaction servent aussi un autre besoin, celui d’identifier les acteurs. La problématique de l’Entreprise 2.0 de capitalisation de connaissances est moins importante dans la Collectivité 2.0. Dans la collectivité 2.0, il faut surtout se doter des bons interlocuteurs, savoir qui possède quelles compétences, qui partage quel centre d’intérêt, et s’il existe une structure de groupe (collectif, association, …). Ce problème d’identification des acteurs s’apparente à un sous problème de celui de la veille d’information. Les pratiques actuelles reposent principalement sur une analyse et un recoupement de l’information. Ce qui revient à fouiller le web bien souvent en saisissant les bons mots clefs dans google et en suivant les liens. Les blogs, les portails et les wikis de particuliers et d’associations sont un véritable pain béni pour les veilleurs. Il en va donc de même pour l’institution d’une collectivité. Il faut sans cesse chercher les nouveaux sites traitant du territoire et les référencer dans le portail institutionnel. Il faut se syndiquer dés que possible à ces sites (s’abonner aux flux RSS proposés, à des newsletters,…). Il faut exploiter ces flux de syndication à hauteur du portail (inclure le flux dans l’interface du portail par exemple). Il faut aussi penser à inscrire l’institution comme utilisateur de ces sites. La pratique de veille inverse existe aussi, plutôt que de chercher l’information, pourquoi ne pas la demander aux utilisateurs. Il faut donc proposer des services qui encouragent l’utilisateur à donner des informations permettant de mieux cerner qui il est. Un site institutionnel pourrait très bien proposer lui même un wiki, une solution de blogs hébergés, un forum,… Il reste une règle fondamentale, l’utilisateur est toujours méfiant quand on lui demande des informations personnelles. Et cette méfiance est sûrement justifiée. La bonne pratique à mes yeux est de ne jamais demander d’informations inutiles ou superflues, de ne demander des informations que pour améliorer les services rendus et de toujours expliciter comment sont exploitées ces informations.

Les sites identifiés par l’institution comme étant générateurs de contenus et donc moyen de récupérer des informations sont aussi des vecteurs de communication. Une fois que l’on a bien identifié les utilisateurs d’un blog ou d’un forum, on peut alors utiliser ce blog ou ce forum pour signaler la création d’une nouvelle information. L’idée est celle de la diffusion de l’information par le réseau. Pensez à cette initiative de IKEA sur facebook. Les outils de réseaux sociaux sont un excellent moyen de diffuser de l’information, encore faut-il bien penser le support. Le lien aux autres sites ou plateformes est dans les deux sens. Le site institutionnel doit rapatrier l’activité du réseau mais doit aussi diffuser sur le réseau (créer un twitter, un post sur facebook,…).

Un autre besoin identifié est celui de la gestion d’événementiels. Il ne faut pas penser communication, visibilité, réseau sur internet déconnecté de la “vie réelle”. La communication de l’institution passe par internet mais passe toujours par l’organisation d’événements réels. Les nouveaux outils de réseaux comme peuplade ou la ruche ont tout à fait compris ce point. Ces applications sont aussi des solutions de gestion d’événements. Cet aspect événementiel est même central dans l’outil. Les discussions dans l’outil permettent de préparer ces événements, elles sont poursuivies lors de l’événement, la discussion au cours de l’événement peut-être synthétisée dans l’outil une fois l’événement clôt. Il y a un aspect organisationnel mais aussi une consultation sur le fond. Qu’attendent les citoyens de l’événement? La consultation grâce à internet offre de grandes perspectives à qui saura traiter l’information produite correctement.

Et on touche là aux limites actuelles de la Collectivité 2.0.

Les deux points sur lesquels la Collectivité 2.0 n’est pas encore une solution sont celui de la consultation et du lien entre les citoyens et les élus. Pour l’instant on manque de pratique et de traitement. Il y a fort à espérer que les technologies du web sémantique pourront apporter au niveau du traitement de l’information provenant de processus de consultation sur internet. Ce qu’il manque avant tout c’est une véritable expérience de la consultation en ligne. Pas juste une analyse de débats sur des forums. Non, une vraie expérimentation dans laquelle des élus et des citoyens acceptent de jouer le jeu d’une consultation par internet. Donc des débats s’incluant dans des processus réels. Des élus qui investissent du temps pour la participation en ligne. Une institution et des élus qui jouent le jeu de la transparence. Il faut un processus ou les décisions prises sont justifiées par le contexte de la consultation. Donc dans le site, la possibilité de dire : l’institution met en oeuvre telle décision prise par tels élus suite aux arguments évoqués par les utilisateurs de tel débat en ligne.

Stage M2R

Vendredi 18 décembre 2009

Le stage vient d’être proposé par Nancy Rodriguez, Bérenger Arnaud et moi même.
Il a déjà trouvé preneur. Donc bienvenue à Arnaud Gaubert dans notre équipe pour quelques mois.

Visualisation de l’activité dans un réseau social

Contexte:
Ce stage s’inclut dans le contexte du web social. La problèmatique est de représenter et visualiser l’activité des membres d’un réseau social. L’activité dans un réseau social concerne la production d’objets d’interactions : les billets sur un blog, les posts sur un forum, les messages sur un mur Facebook, les tags partagés… La visualisation devra prendre en compte l’identité fragmentée de l’utilisateur par l’extistence de ses différents comptes utilisateurs sur les différents outils du réseau (wiki, blog, forum,…).

Objectifs :
L’objectif du stage est d’obtenir une visualisation de l’activité dans un réseau social. Elle représentera des données multi-dimensionelles via un rendu 2D 1/2 ou 3D.
En fonction de la progression du stage, la visualisation proposée évoluera vers un environnement d’interaction avec le réseau social. La visualisation deviendrait une interface d’interaction permettant de propsoer de nouvelles contributions sociales (nouveau commentaire sur un blog par exemple).

Technologies :
Le stage s’appuiera sur les technologies du web sémantique pour la représentation des données (RDF modèles FOAF et SIOC notamment) et sur Adobe Flex 4 pour l’interface de visualisation.

Références :
Un premier travail effectué au LIRMM sur le sujet : http://hal.archives-ouvertes.fr/docs/00/41/09/52/PDF/semiotique_finale.pdf
Le chapitre 3 de la thèse d’Alexandre Passant sur les vocabulaires FOAF et SIOC. http://rd.edf.com/fichiers/fckeditor/File/EDF%20RD/Theses/ThesePassant.pdf

Entreprise 2.0

Mercredi 16 décembre 2009

Je vais tenter dans cet article de faire un point sur ce qu’est l’Entreprise 2.0.

Je m’appuie essentiellement sur le blog de Andrew Mc Afee vu que c’est lui qui a défini le terme en premier.

Une première définition est proposée dans l’article Entreprise 2.0 vs SOA :
L’entreprise 2.0 est l’utilisation d’applications sociales dans les compagnies.
Cette utilisation doit être :

  • optionnelle
  • indépendante de tout workflow préalable (on peut utiliser l’outil sans démarche préalable)
  • indifférente du statut dans l’entreprise
  • adaptée à une multitude de types de données

Dans ce premier article, Andrew McAfee insiste sur le fait que l’Entreprise 2.0 n’est pas une technologie en soi ni dépendant d’une technologie particulière. C’est une pratique qui émerge dans l’Entreprise.

D’ailleurs dans sa deuxième définition d’Entreprise 2.0, Entreprise 2;0 version 2.0, il met beaucoup plus en avant cette émergence:
L’Entreprise 2.0 est l’utilisation émergente de plateformes d’applications sociales au sein des compagnies, ou entre des compagnies et leurs partenaires ou clients.
Andrew McAfee revient encuite sur les termes de sa définition:
Les application sociales permettent aux utilisateurs de se lier, de collaborer via des communications médiées par ordinateur et de former des communautés en ligne.
Des plateformes sont des environnements digitaux dans lesquels contributions et interactions sont globalement visibles et persistentes dans le temps.
L’émergence signifie que les applications sont non contraignantes et qu’elles contiennent des mécanismes qui laissent visibles avec le temps les patterns et les structures inhérents aux interactions entre les utilisateurs.
L’aspect non contraignant est aussi précisé. Cela signifie que l’utilisation des applications doit être conforme à celle présentée dans la première définition (optionelle, indépendant de workflow,…).

Andrew McAfee cite ensuite un ensemble d’outils qui sont compatibles avec cette vision Entreprise 2.0 :

  • les wikis internes
  • les blogs internes
  • les forums internes
  • applications de mises en relation en fonction du marché (concurents, partenaires, clients,…)
  • le tagging partagé dans l’entreprise
  • les blogs d’employés

Par contre, il faut bien avoir en tête que l’on reste dans un contexte de capitalisation de connaissances, ou de veille dans l’Entreprise. Il n’est pas ou peu question de communication externe. L’Entreprise 2.0 n’est pas une solution de communication “vitrine”. C’est une solution de communication interne. Il ne s’agit pas de partager la connaissance de la société avec l’extérieur (en tout cas pas toute la connaissance). C’est pourquoi Wikipedia n’est pas un outil d’Entreprise2.0.

La plupart de ce que l’on appelle l’intranet n’est pas non plus de l’Entreprise2.0 car sa pratique n’est pas émergente.Il y a cette idée d’utiliser les outils que les employés ont décidé de s’approprier et non d’imposer des outils comme c’est le cas avec la plupart des solutions groupware.

Les mails et l’instant messagerie ne sont pas Entreprise2.0 car la discussion n’est ni visible par tous ni persistente.

Dans la thèse d’Alexandre Passant, on retrouve une traduction de la vision de Andrew McAfee :

vision où les outils de plus en plus courants du Web 2.0 (blogs, wikis, services de partage de contenus, pratiques de tagging …) font leur apparition dans les systèmes d’information organisationnels.”

Alexandre Passant fait référence à l’acronyme SLATES proposé par Andrew McAfee dans l’article Enterprise 2.0 : The dawn of emergent collaboration. Alexandre Passant propose de s’appuyer sur la technologie du web sémantique pour étendre cet acronyme en ce qu’il appelle SemSLATES.

Mais revenons pour l’instant sur SLATES. SLATES est utilisé par Andrew McAfee pour présenter les 6 composantes incontournables des technologies de l’Entreprise 2.0:

  • Search. Les utilisateurs doivent avoir une solution leur permettant de trouver ce qu’il cherchent.
  • Links. Les utilisateurs doivent pouvoir créer des liens entre les ressources de façon à faire ressortir ce qui est pertinent à la façon de google.
  • Authoring. Les utilisateurs veulent être auteurs (pas au sens de Shakespeare). Ils veulent faire partager leurs expériences, centres d’intérêts,…
  • Tags. La pratique du Tagging est devenue très utile pour caractériser le thème d’une ressource et pour catégoriser les ressources. De plus, les tags permettent de garder  une trace de l’activité, du passage d’un utilisateur.
  • Extensions. Les extensions sont des formes d’assistances et de recommandations par le système. L’exemple courant est celui d’Amazon qui recommande des achats en fonction des achats précédents, des achats des autres et de votre visite du site.
  • Signals. Les signaux sont tout ce qui permet de rester au courant des modifications des ressources. Par exemple, RSS est une solution pour rester au courant des derniers ajouts dans un site type blog, wiki, forum…

Le paradigme SemSLATES propose la mise en place d’une architecture de médiation sociale et sémantique. Le travail d’Alexandre Passant repose essentiellement sur les technologies du web sémantique. Il a utilisé et proposé plusieurs ontologies web afin de représenter les connaissances et l’activité de production de ces connaissances par un réseau d’individus dans un contexte d’utilisation d’outils de type blogs et wikis et la pratique du tagging. Graĉe à cette approche sémantique, il a pu faire des propositions concrètes (des applications) permettant d’améliorer la recherche (Search), l’asssistance/recommandation (Extensions) et les signaux (Signals). Il a surtout pu mettre en place une architecture de médiation permettant de créer un véritable ensemble cohérent d’outils.

Le premier problème qu’a tenté de résoudre Alexandre Passant est celui de l’hétérogénéité des formats. Il existe plusieurs solutions logicielles pour mettre en place une solution Entreprise2.0. Cependant, ces solutions ne sont pas interopérables. Ce qui conduit à une fragmentation de l’information alors que à priori, l’objectif de l’Entreprise 2.0 est au contraire la capitalisation de l’information.

Le deuxième problème est lié à la nature plein-texte de l’information dans les outils (wikis, forums, blogs,…). Cette nature plein-texte fait que le sens (sémantique) de l’information contenue dans un billet de blog ou une page wiki est très difficile à extraire. Concrétement, ce problème réduit l’efficacité des recherches qui se limitent souvent à vérifier la présence ou non d’un terme dans le texte.

Le troisième problème soulevé est celui du tagging. L’avantage est que la catégorisation est faite par les utilisateurs mais le tagging pose des problèmes :

  • l’ambiguïté des termes. Dans une folksonomie, un tag n’est pas défini. Il n’a aucun sens qui lui est associé (si je vous dis “Pilote”, je parle du journal, du pilote de voiture ou du poisson?).
  • le problème d’hétérogénéité. A l’inverse du problème de l’ambiguïté. Il existe parfois plusieurs tags pour désigner un même objet.
  • absence d’organisation. Il n’y a aucune relation entre les tags dans une folksonomie. Du coup, on ne peut pas dire : tout ce qui parle d’énergies renouvelables parle aussi d’énergie.

Le travail de Alexandre Passant permet notamment de lister les limites de l’approche SLATES :

  • Search. Pas de prise en compte de l’ambiguïté, de l’hétérogénéité, de la nature plein-texte et de l’information fragmentée.
  • Links. Les seuls liens possibles entre ressources sont des liens hypertextes sans sémantique.
  • Authoring. Les utilisateurs produisent des documents mais pas des concepts (toujours l’absence de sémantique).
  • Tags. Ambiguïté, hétérogénéité, pas d’organisation.
  • Extensions. Repose uniquement sur des méthodes statistiques ou de co-occurence.
  • Signals. Problème d’abondance de l’information. Pas de filtres sémantiques par exemple.

En résumé, on peut dire que Alexandre Passant montre que l’Entreprise 2.0 n’est pas encore au point pour le traitement de l’information. On peut faire de la veille efficace au sens rappatrier et stocker de l’information. Mais il n’y a pas grand chose pour proposer une meilleure lecture de cette information. Quelque chose qui permettrait aux utilisateurs de vraiment partager la connaissance. Il n’y a pas de représentation de cette connaissance.

Par contre, les applications web 2.0 apportent des formes nouvelles et efficaces de communication. C’est le sujet du billet de Yves Caseau sur la communication en entreprise. Dans son billet, Yves Caseau identifie 8 formes de communication “nouvelles”. Le billet de Yves Caseau fait état d’un travail de définition non fini encore. C’est pourquoi je vous invite à lire ce billet plutôt que de le résumer ici.

Ce que l’on peut dire pour synthètiser, c’est qu’il existe un véritable progrés en terme de communication dans l’entreprise grâce à l’Entreprise2.0. D’ailleurs plus largement, grâce au web 2.0, communiquer n’a jamais été aussi simple comme il est dit dans ces quelques articles de Philippe Testard-Vaillant regroupés dans un numéro du journal du CNRS. Cependant, sur le web en général comme dans le contexte de l’entreprise, il reste des progrès à faire en ce qui concerne le traitement, l’analyse de l’information.

social web and semantic web

Lundi 30 novembre 2009

Nous avons reçu Freddy Limpens comme invité au labo vendredi 27 décembre à l’occasion d’un séminaire doctorants. Merci encore à Guillaume Artignan pour l’organisation.
Le sujet de la présentation de Freddy Limpens : Social web and semantic web towards synergy between folksonomies and ontologies.

La page de Freddy sur son blog au sujet de cette journèe

Ce que j’ai retenu très rapidement de cette présentation :

  • Un état de l’art sur les folksonomies et les ontologies. Les limites et apports de chaque approche.
  • Comment lier les deux sur le web?
  • Un point sur les ontologies SIOC, FOAF, SKOS, comment connecter le réseau via les connaissances partagées. Trés intéressant en ce qui concerne la représentation de l’identité numérique et de l’activité sur le web.
  • En dernière partie, proposition d’un enrichissement sémantique des folksonomies permettant à chacun d’exprimer un point de vue sur une relation entre tags. Cette dernière partie rejoint vraiment l’une des pistes que l’on aimerait explorer dans ma thèse sur comment représenter le point de vue des utilisateurs sur une ressource web participatif (billet de blog ou de forum par exemple).

Les slides de Freddy Limpens sont disponibles sur Slideshare.

Linked data

Mardi 13 octobre 2009

Je viens de trouver cette vidéo sur TED de tim berners lee sur linked data.

Bref, que dire de plus à part : c’est tout à fait ça!!

I want raw data now !!