Archive pour le mot-clef ‘débat’

RDF et les débats en ligne

Lundi 28 juin 2010

Cela fait maintenant deux ans que je travaille dans le cadre de l’ANR intermed sur les débats en ligne. Et après deux ans, nous avons via de nouvelles rencontres, de nouvelles opportunités d’échange sur le sujet. J’en profite alors pour recommander des formats d’échange de données entre différentes applications dédiées aux débats en ligne. Les formats sont des utilisations conjointes de divers vocabulaires RDF.

Il faut dire que ça commence à faire pas mal de temps qu’on nous parle de démocratie participative et que sur le net, il n’y a pas grand chose. Un blog institutionnel par là (voir le travail de blog-territorial et leur livre sur l’usage des blogs dans des collectivités), un élu qui raconte sa vie ici et là, une candidate qui propose une plateforme que je comprends toujours pas à quoi elle sert … En fait si, il y a beaucoup de choses. Il y a beaucoup de forums ou blogs ou l’on peut débattre, quelques wikis aussi. Mais il n’y a pas de réelle plateforme pour les débats qui permette de passer à une grande échelle (de sujets et d’utilisateurs). Il n’y a pas non plus de système qui fasse correctement le lien entre les discussions (en ligne ou non) et les décisions ainsi que leurs mises en application.

L’objectif de l’article n’est pas de dresser un état de l’art de la pratique de débats en ligne mais de proposer des formats d’échanges de données afin de faciliter la création d’une véritable plateforme de débat (ou de transformer le web en une véritable plateforme de débats …).

Dans une vision trés web 2.0, le débat 2.0 permettrait de partager les données entre applications, offrant des possibilité de réutilisation et de traitement de ces données (on veut des Mashups pour le débat !!). Au lieu d’encourager une collectivité à avoir son propre blog et imposer celui-ci comme espace de discussion privilégié des administrés, pourquoi ne pas proposer à la collectivité une application qui lui permette d’aggréger les flux RSS des blogs déjà existant et de synthétiser les critiques qui y sont exprimées.

L’article se compose en deux parties:

  1. La première partie a pour objectif de présenter ce qu’est un débat en ligne et les problématiques d’interopérabilité intrinséque à cette notion.
  2. La deuxième partie présente un ensemble de vocabulaires RDF et leur utilisation conjointe pour représenter les éléments d’une discussion. Les vocabulaires choisis ont leur limite mais l’un des avantages de RDF est que des ponts existent entre les vocabulaires (cf le projet LOD) et que les vocabulaires peuvent être étendus (ajout de classes plus spécialisées, ajout de propriétés, …). La solution de “format” ici présentée n’est donc qu’un début de proposition que nous serons amenés à faire évoluer, cependant, ce qui est présenté ici devrait constituer un noyau stable.

Un débat en ligne c’est quoi ?

Déjà, il m’est très difficile de définir ce qu’est un débat. Alors définir ce qu’est un débat en ligne… Je vous propose un début de définition mais je vous invite à m’aider à la raffiner.

Un débat en ligne c’est un débat supporté (au moins en partie) par des applications web.

Une fois qu’on a dit ça, on n’a pas dit grand chose.

Voici quelques citations pour m’aider à définir ce qu’est un débat.

  • La version wikipédia : Un débat est une discussion sur un sujet, précis ou de fond, annoncé à l’avance, à laquelle prennent part des individus ayant des avis, idées, réflexions ou opinions divergentes pour le sujet considéré.
  • Dans le décret de 2002 relatif à l’organisation du débat public, on observe qu’un débat public est évalué par une commission (de trois à sept membres), avec un président. Une personne publique ou un maître d’ouvrage porteur du débat doit proposer au président de la commission un dossier à destination du public. Ce dossier peut contenir des documents de références jugés nécessaires pour le débat. Ce dossier est donc évalué par la commission avant que le débat public ne soit organisé. Le porteur du débat peut également proposer des modalités d’action et un calendrier. Sont susceptibles de donner naissance à un débat, des projets d’aménagement ou d’équipement d’intérêt national de l’Etat, des collectivités territoriales, des établissements publics, et des personnes privées entrant dans un ensemble de catégories listées dans le décret. La commission peut estimer que le débat n’a pas lieu d’être et proposer une concertation à la place. Le bilan du débat ou de la concertation, doit être publié et transmis aux décisionnaires.
  • Dans la Loi du 27 février 2002 relative à la démocratie de proximité, Champ d’application et objet du débat public : La Commission nationale du débat public, autorité administrative indépendante, est chargée de veiller au respect de la participation du public au processus d’élaboration des projets d’aménagement ou d’équipement d’intérêt national de l’Etat, des collectivités territoriales, des établissements publics et des personnes privées, relevant de catégories d’opérations dont la liste est fixée par décret en Conseil d’Etat, dès lors qu’ils présentent de forts enjeux socio-économiques ou ont des impacts significatifs sur l’environnement ou l’aménagement du territoire. (…) « En outre, la Commission nationale du débat public veille au respect de bonnes conditions d’information du public durant la phase de réalisation des projets dont elle a été saisie jusqu’à la réception des équipements et travaux. « Elle conseille à leur demande les autorités compétentes et tout maître d’ouvrage sur toute question relative à la concertation avec le public tout au long de l’élaboration d’un projet. « La Commission nationale du débat public a également pour mission d’émettre tous avis et recommandations à caractère général ou méthodologique de nature à favoriser et développer la concertation avec le public. « La Commission nationale du débat public et les commissions particulières ne se prononcent pas sur le fond des projets qui leur sont soumis.
  • (Testard-Vaillant, 2008) parle de La place publique ou de l’espace public qui « est un des concepts fondamentaux de la démocratie. Il désigne le lieu symbolique où peuvent s’exprimer toutes les opinions qui structurent le jeu politique, où l’on traite des questions relevant de la collectivité ».
  • Chez (Vedel, 2003), le débat est une phase séparée de l’information des citoyens et de la délibération. C’est l’une des 3 dimensions (information, débat, délibération) de son cube de la démocratie. Le débat ou la discussion permet de mesurer l’étroitesse ou la fermeture de l’espace public. Le débat est la phase entre l’information et la délibération. Le débat s’inscrit donc dans un processus de prise de décision.
  • (Bidima, 1997 p113 ) : Toute palabre suppose la prédisposition des groupes ou sujets en débat à mettre en péril leur vérité par la confrontation. Il s’établit implicitement un mouvement de corrosion des positions assurées et absolues. Palabrer signifie mettre “ses absolus” devant la possibilité de leur relativisation. Ce jeu entre un absolu qui devient relatif et l’émergence du seul absolu qui est le relatif, constitue l’une des composantes du mouvement de prise et de dépossession de la parole qu’est la palabre.
  • (Callon et al, 2002) définissent l’objectif d’un débat public de la façon suivante : “il doit organiser l’accueil des groupes concernés et faciliter la réduction des incertitudes.”
  • (Fung, 2006) estime que les mécanismes participatifs sont évalués selon trois critéres : la légitimité, l’équité et l’efficacité. Les indicateurs pour cette évaluation sont : le champ de participation (qui peut s’exprimer et qui s’exprime), les modes de communication et de prise de décision, l’impact réel des discussions sur les prises de décision.
  • (Vignaux, 1988) la définition d’Aristote de la discussion dialectique est la suivante : c’est un jeu à deux où le couple de partenaires incarne à la fois deux oppositions binaires, celle de l’affirmation et de la négation, celle de la victoire et de la défaite.
  • (Chabrol, 1999), une opinion est un acte discursif où l’énonciateur « modalise » explicitement ou implicitement l’objet de son énonciation avec les dimensions « possible/impossible », « souhaitable/non souhaitable », « beau/laid », « agréable/désagréable » …

On ne trouve pas vraiment de définition de ce qu’est un débat public sur le site du CNDP. On apprend ce qui justifie la mise en place de débats publics, qui sont les acteurs important dans l’organisation du débat et quel est l’objectif principal d’un débat (consulter et informer le citoyen, le faire participer à l’élaboration d’un projet socio-environnemental qui le concerne). Mais on ne nous fournit pas de définition formelle de ce qu’est un débat.

Un débat s’inscrit dans un processus de prise de décision. Le mot débat peut concerner le processus complet ou une étape uniquement du processus de décision. Dans tous les cas, la discussion est un élément central du débat. C’est un échange qui permet d’exprimer des opinions contraires, des oppositions, de revoir ses certitudes ou incertitudes à la lumière de celles des autres participants dans le but d’aider à prendre une décision. Un débat fait intervenir des acteurs différents : des organisateurs, des évaluateurs, des groupes concernés qui se sont manifestés ou qu’il faut identifier.

Ajoutons que pour certains, la discussion est source de formation et d’information, pour d’autres, il faut déjà être informé pour pouvoir discuter. Pour certain il faut réduire les incertitudes des groupes concernés, pour d’autre, il faut aider le décideur.

Soulignons l’importance du sujet et de l’expression du sujet. L’un des échecs du débat public sur les nanotechnologies semble être d’avoir voulu traiter des Nanos dans leur ensemble (cf le site du débat Nano). La formulation du sujet d’un débat a de l’importance, “êtes vous pour ou contre les nanotechnologies ? ” est différent de “sur les options générales en matière de développement et de régulation des nanotechnologies”.

Et enfin, il ne faut pas sous-estimer l’aspect “image” de l’organisateur du débat public. Un autre facteur d’échec du débat public sur les nanotechnologies est peut-être d’avoir été organisé par le CNDP, organisme d’état jugé comme parti pris dans la discussion par de nombreux participants.

Dans notre approche, jusqu’ici, nous avons utilisé des ressources de départ (en l’occurence des documents html en ligne) comme point d’accroche des discussions. Nous avons adopté la position de l’information avant la discussion. Cependant, les deux approches ne sont pas incompatibles. La discussion permet dans tous les cas de s’informer.

Peut-on considérer qu’il existe déjà des outils de débats en ligne ?

Si l’on considére qu’un débat est une discussion dans laquelle s’expriment des opinions alors oui il existe déjà des outils. Tous les outils de discussion permettent d’exprimer des opinions sur des sujets. Après, le traitement de ces opinions n’est pas toujours une mince affaire (Wilson et al, 2009). Dans ce cas, il existe des solutions pour déceler les opinion, mais limitées par des problèmatiques de taille et de dynamique. La plupart des solutions de détection d’opinions sont effectuées à posteriori, sur des corpus ciblés et de taille limitée. Pas de fouille d’opinion en temps réel.

Si l’on considére que le débat est un processus de décision à part entiére, alors ce processus peut-être découpé en étapes (information, discussion, décision, ou autre découpage). Chaque étape pouvant être plus ou moins soutenue par des outils en ligne, comment faire en sorte que les données produites puissent être utiles d’étapes en étapes (que ces étapes soient intégralement en ligne, ou intégralement en présentiel ou les deux) ?

Nous sommes dans une vision du débat en ligne ou la phase de discussion est primordiale mais non suffisante. Nous sommes dans une vision du débat ou il y a un complément entre “réel et virtuel” (virtuel au sens de numérique). Dans ce contexte, il existe déjà des applications et d’autres sont à inventer. Cette hétérogénéité d’outils pose avant tout un problème d’interopérabilité.

Par exemple, on peut concevoir un outil pour aider à constituer un réseau. Ce réseau aura ensuite besoin de discuter en ligne et en présentiel. Il y aura donc besoin d’outils de discussion en ligne mais aussi d’outils d’organisation d’événements. Il faudra à un moment trouver des documents de références et en produire (donc outils d’annotations, de bookmarking et outils de co-rédaction). A certains moments il faudra prendre des décisions (besoin d’outils de vote). Et à chaque phase en présence, il faudra se référer à ce qui a été produit en ligne (outils de production de synthèses) et éventuellement faire part de ce qui a été dit en présence via des outils en ligne pour ceux qui n’ont pas pu venir aux événements présentiels…

Soit on imagine faire un outil monolithique qui englobe toutes les fonctionnalités nécessaires au débat, soit on conçoit des outils indépendants en garantissant des ponts entre ces outils.

Nous avons fait le choix de la deuxième solution parce que cela permet de réintégrer des outils déjà existants, cela permet de travailler plus facilement à plusieurs acteurs (chaque acteur pouvant développer un module indépendant), cela permet de prévoir des environnements modulables et adaptables à des formules de débats différents (comme le dit le CNDP, à chaque débat ses modalités d’action).

Nous allons dans la deuxième partie de cet article traiter d’un début de solution pour l’interopérabilité.

RDF c’est quoi et à quoi ça sert pour les débats?

Maintenant que l’on a fait le constat qu’il n’y avait pas de réelle application existante pour les débats en ligne mais qu’il existe un ensemble d’applications pouvant supporter des processus de débats en présences, il faut penser à l’articulation de ces outils en ligne entre eux et à l’articulation de ces outils avec les phases de débats en présentiel.

Le premier problème que cela pose est celui des formats de représentation des données. Il faut des formats ouverts, facile à comprendre par des programmes et par des humains. RDF nous semble donc être un bon candidat.

Qu’est-ce que RDF ?

RDF est un langage de description de méta-données. Une méta-donnée est une donnée sur une donnée. Par exemple, vous accédez à un document : la date de création de ce document, l’auteur de ce document sont des méta-données.

Sur la page du W3C consacrée à RDF, la première phrase est : RDF est un modèle standard pour l’échange de données sur le web.

La syntaxe de RDF est basée sur des triplets : sujet-prédicat-objet. Ceci permet d’exprimer des relations binaires entre des ressources. Par exemple, sujet:  Natoine, prédicat : est auteur, Objet : de ce document.

RDF permet de représenter des relations entre des ressources.

RDF permet de typer le lien entre des ressources et de typer les ressources. L’exemple précédent devrait être complété de la façon suivante : sujet : Une Personne identifié comme étant Natoine, est lié : par un lien de type “est auteur”, à une ressource objet : ce document qui est un Billet de blog. On sait que Natoine est une Personne, que le lien est de type est_auteur et que le document est un Billet de Blog. RDF utilise des notions de Classes (Personne, Billet de blog, …), de Relations (est auteur) et d’instances (Natoine est une Personne).

Une ressource est identifiée par une URI. Une URI est un identifiant unique, c’est cette unicité qui est importante. Une URL peut-être utilisée en tant qu’URI.

L’un des intérêts de RDF, c’est que grâce à son mécanisme d’identification des ressources, il est possible à plusieurs personnes de créer des méta-données sur une même ressource et il est possible d’aggréger ces différentes méta-données. RDF semble avoir été inventé pour faire des mashups ;) . Par exemple, le site lastfm va créer un descriptif des musiques que j’écoute. Facebook va créer un descriptif de ma liste d’amis. Dans mon blog je crée un ensemble d’articles. Dans delicious je renseigne les pages web que je lie et les tags que j’utilise. Si ces systèmes proposaient tous des exports RDF des données précitées, je pourrai faire des recoupements comme par exemple savoir quels sont mes amis facebook qui me répondent sur mon blog ou les musiques que nous écoutons en commun, les tags communs que nous utilisons…

Concrétement comment fonctionne RDF?

J’ai présenté dans un article précédent de ce blog un cas d’utilisation du vocabulaire FOAF.

Je vais revenir sur cet exemple pour mieux présenter ce que permet de faire RDF.

La spécification de RDF nous apprend que RDF est un langage de description. Si on y regarde de plus prés, RDF est un méta-langage de description, c’est à dire qu’il permet d’écrire des langages de description (aussi appelés vocabulaires).

RDFS (pour RDF schéma) défini les expressions de base du langage RDF. RDFS définit un ensemble de classes et de propriétés. Dans les classes de RDF, on trouve la classe Classe et la classe Property.

En gros RDF permet d’écrire que Personne est une Classe que cette classe a, entre autres, une Propriété est_auteur. RDF permet aussi de préciser que la Propriété est_auteur permet de relier des instances de la classe Personne et des instances de la classe Document (grâce au Range et au Domain).

Bref, RDF permet de définir des vocabulaires, c’est le cas du Vocabulaire FOAF, donc de fournir un descriptif de classes et de relations entre ces classes.

A partir de ce vocabulaire, et toujours avec la même syntaxe, il devient possible d’exprimer des bases de faits. Il est possible grâce à FOAF de décrire un ensemble d’instances de Personne et les relations entre ces personnes.

Pourquoi définir plusieurs Vocabulaires ?

Il faut peut-être revenir sur la définition de ce qu’est une Ontologie. Le but d’un langage de description est de fournir une syntaxe pour écrire une Ontologie.

Une Ontologie, au sens informatique inspiré du sens philosophique, est une description formelle ou semi-formelle du monde.

Le but ultime est donc de pouvoir décrire le monde dans son ensemble, c’est à dire tous les éléments du monde et leurs relations, toutes les règles,  et ce selon tous les points de vue. Mais aussi de pouvoir raisonner (au sens de créer de nouvelles connaissances) à partir de cette description du monde.

Cependant, il faut constater que ce travail est impossible. Une description du monde dans son ensemble est une tâche colossale, le monde est en évolution constante, le point de vue des uns n’est pas toujours compatible avec le point de vue des autres, …

Du coup au lieu de parler d’Ontologie pour représenter le monde dans son ensemble, on préférera parler d’ontologies légéres permettant de représenter une partie bien définie du monde.

Par exemple, le vocabulaire FOAF permet de faire une ontologie des Personnes et de leurs relations. Le vocabulaire Dublin Core permet de faire une ontologie des documents. Et il existe de nombreuses ontologies pour représenter bien des choses différentes.

Quel format de données utiliser pour les débats ?

Le constat est fait, il faut des outils différents pour les différentes phases des débats. Nous proposons d’utiliser RDF pour représenter les données produites par ces débats.

Maintenant, allons-nous proposer un Vocabulaire pour les débats ?

La réponse est non. Comme dit précédement, il existe déjà des outils qui peuvent servir aux débats. Il existe aussi des vocabulaires pour représenter les données produites par ces différents outils.

Nous n’allons donc pas proposer un Vocabulaire unique pour représenter le débat dans son ensemble, nous allons utiliser des vocabulaires existants pour représenter certaines données des débats.

Par exemple, FOAF nous permettra de représenter les liens entre les individus.

SIOC nous permettra de représenter les productions des individus dans des discussions.

Dublin Core et RSS nous permettront de représenter des informations sur les documents de références servant à informer les participants des débats et les documents produits par les débats.

Annotea permettra de représenter des annotations (c’est à dire des liens entre de nouvelles données et des sélections de documents).

Il existe aussi des vocabulaires pour représenter d’autres données comme des événements (cf travail d’état de l’art et LODE de Raphaël Troncy and co), des coordonnées géographiques, des tags (MOAT, NiceTag), …

Nous allons détailler ici des solutions concrétes de représentation des données de la discussion. Pour le reste, il faut bien comprendre que nous nous inscrivons dans cette démarche de choix de vocabulaires pour lesquels il existe des “ponts” vers d’autres vocabulaires. Par exemple, le vocabulaire SIOC définit une classe UserAccount comme étant une sous-classe de OnlineAccount du vocabulaire FOAF. Cette démarche de lier des ontologies les unes aux autres est centrale dans le projet Linking Open Data. Elle accentue encore plus les possibilités d’aggrégations de méta-données sur des ressources.

Concrétement nous représentons quelles informations et comment ?

Profil “minimal” d’un utilisateur

Le profil minimal d’un utilisateur consiste à associer une ressource à un compte utilisateur. Ceci est fait par la classe UserAccount du vocabulaire SIOC.

Un utilisateur en lui-même est représenté par la classe Person de FOAF.

Ceci sert de point de départ à la représentation du réseau social et d’autres informations de profil de l’utilisateur.

Deux exemples suivent ou nous représentons une personne qui posséde un compte utilisateur avec le login Natoine dans la plateforme de débat “debat2.0.org” (plateforme fictive). Le premier exemple part d’une personne et présente l’un de ses comptes. Le deuxième part d’un compte et présente la personne à qui le compte appartient.

<!– Exemple 1 –>

<?xml version =”1.0″ encoding =”utf-8″?>
<rdf:RDF xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”
xmlns:rdfs=”http://www.w3.org/2000/01/rdf-schema#”
xmlns:foaf=”http://xmlns.com/foaf/0.1/”
xmlns:sioc=”http://rdfs.org/sioc/ns#”>
<foaf:Person rdf:about=”http://www.natoine.fr/#me” xml:base=”http://www.natoine.fr”>
<foaf:account>
<sioc:UserAccount rdf:about=”http://www.debat20.com/#natoine” rdfs:label=”natoine”>
<!– Autres informations sur le compte –>
</sioc:UserAccount>
</foaf:account>
<!– Autres informations sur la personne –>
<rdfs:seeAlso rdf:resource=”http://www.natoine.fr/natoine.rdf”/>
</foaf:Person>
</rdf:RDF>

<!– Exemple 2 –>

<?xml version =”1.0″ encoding =”utf-8″?>
<rdf:RDF xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”
xmlns:rdfs=”http://www.w3.org/2000/01/rdf-schema#”
xmlns:foaf=”http://xmlns.com/foaf/0.1/”
xmlns:sioc=”http://rdfs.org/sioc/ns#”>
<sioc:UserAccount rdf:about=”http://www.debat20.com/#natoine” rdfs:label=”natoine”>
<sioc:account_of>
<foaf:Person rdf:about=”http://www.natoine.fr/#me” xml:base=”http://www.natoine.fr”>
<!– Autres informations sur la personne –>
<rdfs:seeAlso rdf:resource=”http://www.natoine.fr/natoine.rdf”/>
</foaf:Person>
</sioc:account_of>
<!– Autres informations sur le compte –>
</sioc:UserAccount>
</rdf:RDF>

Pour un exemple plus complet, voir mon article de blog sur FOAF.

Deux remarques :

  • la plupart des propriétés sont définies avec leur propriété inverse. Ici, on a montré qu’il existait une propriété foaf:account et une propriété sioc:account_of qui sont l’inverse l’une de l’autre.
  • Il n’est pas obligatoire de donner toutes les informations au sujet d’une instance. Ici j’utilise la propriété rdfs:seeAlso pour renvoyer à un autre document RDF dans lequel je donne plus d’informations sur la ressource. Cette pratique n’est pas obligatoire mais elle est recommandée. Elle permet d’alléger un document RDF et de guider la recherche d’information sur une ressource.

Participation d’un utilisateur

La participation d’un utilisateur est pour l’instant essentiellement représentée par la classe Post de SIOC. Un Post est un élément de discussion comme il est possible d’en émettre dans un blog ou un forum. L’utilisateur est relié à un Post comme en étant l’auteur grâce à la relation has_creator de SIOC. Cette relation lie le Post au UserAccount de la personne.

Le Post est aussi lié au site, ou espace de discussion, dans lequel il a été émis par la relation has_container de SIOC. Un espace de discussion étant représenté par la classe Forum de SIOC. Un commentaire de blog est représenté par la classe BlogPost de l’extension SIOC types, cette classe BlogPost étant une sous-classe de la classe Post. Un BlogPost est contenu par un Blog qui est une classe spécialisant la classe Forum. Il deviendra peut-être nécessaire de définir d’autres classes étendant la classe Forum pour définir de nouveaux espaces de discussion. Mais il existe déjà pas mal de classes intéressantes, comme une classe Wiki, dans l’extension SIOC types. Il y a aussi d’autres classes et propriétés définies dans SWAN.

Bien d’autres informations peuvent être ajoutées à un Post en utilisant des propriétés de SIOC, ou de Dublin Core et RSS (puisque Dublin Core et RSS permettent d’ajouter des informations sur toutes ressources).

Un exemple ou nous représentons deux posts créés par l’utilisateur Natoine, un dans un forum, un dans un blog :

<?xml version =”1.0″ encoding =”utf-8″?>
<rdf:RDF xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”
xmlns:rdfs=”http://www.w3.org/2000/01/rdf-schema#”
xmlns:foaf=”http://xmlns.com/foaf/0.1/”
xmlns:sioc=”http://rdfs.org/sioc/ns#”
xmlns:dc=”http://purl.org/dc/elements/1.1/”
xmlns:dcterms=”http://purl.org/dc/terms/”
xmlns:content=”http://purl.org/rss/1.0/modules/content/”
xmlns:siocType=”http://rdfs.org/sioc/types”
>
<sioc:UserAccount rdf:about=”http://www.debat20.com/#natoine” rdfs:label=”natoine”>
<rdfs:seeAlso rdf:resource=”http://www.debat20.com/useraccount?p=natoine”/>
<sioc:creator_of>
<!– Premier Post –>
<sioc:Post rdf:about=”http://www.natoine.fr/blog/?p=437″>
<sioc:has_container>
<siocType:Weblog rdf:about=”http://www.natoine.fr/wordpress/?sioc_type=site#weblog”>
<sioc:name>Main blog at natoine</sioc:name>
</siocType:Weblog>
</sioc:has_container>
<dcterms:created>2010-02-01T15:56:28Z</dcterms:created>
<sioc:content>le commentaire libre version texte simple.</sioc:content>
<content:encoded><![CDATA[ le commentaire libre version HTML ]]></content:encoded>
<sioc:topic rdfs:label=”Programmation” rdf:resource=”http://www.natoine.fr/wordpress/?cat=5″/>
<sioc:topic rdfs:label=”Tutoriels” rdf:resource=”http://www.natoine.fr/wordpress/?cat=4″/>
<sioc:links_to rdf:resource=”http://www.natoine.fr/wordpress/?p=393″ rdfs:label=”tutoriel précédent sur la POO java”/>
<sioc:links_to rdf:resource=”http://java.sun.com/docs/codeconv/html/CodeConvTOC.doc.html” rdfs:label=”la convention de codage recommandée par sun”/>
<sioc:has_reply>
<sioc:Post rdf:about=”http://www.natoine.fr/forum/?p=444″/>
</sioc:has_reply>
<sioc:reply_of>
<sioc:Post rdf:about=”http://www.natoine.fr/wordpress/?p=398″/>
</sioc:reply_of>
</sioc:Post>
<!– Deuxième Post –>
<sioc:Post rdf:about=”http://www.natoine.fr/forum/?p=444″>
<sioc:has_container>
<sioc:Forum rdf:about=”http://www.natoine.fr/wordpress/?sioc_type=site#forum”>
<sioc:name>Main forum at natoine</sioc:name>
</sioc:Forum>
</sioc:has_container>
<dcterms:created>2010-03-01T15:56:28Z</dcterms:created>
<sioc:content>le commentaire libre version texte simple.</sioc:content>
<content:encoded><![CDATA[ le commentaire libre version HTML ]]></content:encoded>
<sioc:topic rdfs:label=”Programmation” rdf:resource=”http://www.natoine.fr/wordpress/?cat=5″/>
<sioc:topic rdfs:label=”Tutoriels” rdf:resource=”http://www.natoine.fr/wordpress/?cat=4″/>
<sioc:has_reply>
<sioc:Post rdf:about=”http://www.natoine.fr/forum/?p=445″/>
</sioc:has_reply>
<sioc:reply_of>
<sioc:Post rdf:about=”http://www.natoine.fr/blog/?p=437″/>
</sioc:reply_of>
</sioc:Post>
</sioc:creator_of>
</sioc:UserAccount>
</rdf:RDF>

De la même façon que précédemment, puisque il existe des propriétés inverses, il est possible de décrire un site web et l’ensemble des messages qu’il contient. Par exemple, vous pouvez accéder à l’export SIOC des données de ce blog.

La description d’un Post peut déclarer qui en est l’auteur par la relation sioc:has_creator.

Un graphe de discussion

Un graphe de discussion s’obtient en liant des Posts par les status de réponses. Un Post peut être une réponse à un ou plusieurs autres Post par la relation reply_to de SIOC. Un Post peut avoir des réponses par la relation has_reply de SIOC.

Des POSTS peuvent être des réponses les uns aux autres sans nécessairement provenir d’un même espace de discussion.

Il est aussi possible de dire qu’un Post fait référence à une autre ressource par la relation links_to de SIOC.

Documents de référence

Les documents de référence sont des ressources web HTML ou vidéo ou audio. En utilisant les vocabulaires Dublin Core et RSS, on peut décrire la plupart des informations utiles sur ces documents comme qui en est auteur, le contenu, la date de mise en ligne … On peut éventuellement utiliser la classe Document de FOAF. Si le document est d’une autre ressource que texte, il est possible d’utiliser d’autres vocabulaires comme le vocabulaire Media et ses extensions Video et Audio.

Plutôt que de détailler des exemples ici, je vous invite à consulter un exemple simple sur le site de Dublin Core et un exemple de RSS1.0 utilisant le module Dublin Core.

Annotations

Les annotations telles que nous les définissons recouvrent toute pratique visant à ajouter des données sur des documents ou des sélections de documents.

On peut alors considérer un Post sur un blog comme étant une annotation d’article de blog, un Post sur un forum comme étant une annotation de la discussion dans son ensemble ou du Topic de celle-ci.

Les annotations faisant référence à des pratiques classiques de discussion sur le web comme les blogs ou forums ont été présentées précédemment.

Nous allons ici détailler un type d’annotations : les annotations portant sur des sélections de document.

Nous nous basons sur le vocabulaire Annotea pour représenter ce type d’annotations.

Les éléments important à représenter dans une annotation :

  • L’annotation en elle-même, représentée par la classe annotea:Annotation
  • La ressource annotée, liée à l’annotation par la propriété annotea:annotates
  • L’emplacement exact annoté, ou la sélection de la portion de ressource annotée, lié à l’annotation par la propriété annotea:context.
  • Le corps de l’annotation, ou la nouvelle information apportée par l’annotation, liée à l’annotation par la propriété annotea:body.

Dans le cas d’une ressource HTML annotée, l’emplacement exact, la sélection est précisée par l’utilisation d’un XPointer.

Dans notre cas, la plupart des annotations que nous représentons sont dites discursives. Les informations ajoutées à des portions de documents sont des commentaires saisis par les utilisateurs dans le cadre d’une discussion. Je vous renvoie à la thèse de Gaëlle Lortal pour en savoir plus sur l’annotation discursive. Dans ce contexte, nous avons choisi de représenter le corps de l’annotation par la classe Post de SIOC.

Un exemple d’annotation discursive :

<?xml version =”1.0″ encoding =”utf-8″?>
<rdf:RDF xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”
xmlns:rdfs=”http://www.w3.org/2000/01/rdf-schema#”
xmlns:sioc=”http://rdfs.org/sioc/ns#”
xmlns:dc=”http://purl.org/dc/elements/1.1/”
xmlns:annotea=”http://www.w3.org/2000/10/annotation-ns”
>
<annotea:Annotation rdf:about=”http://www.natoine.fr/annotation/?p=479″>
<annotea:annotates rdf:resource=”http://www.jeanSallantin.fr/homepage”/>
<annotea:body>
<sioc:Post rdf:about=”http://www.natoine.fr/wordpress/?p=401″ dc:title=”IPC ou communication inter portlet 2. JSR286″>
<rdfs:seeAlso rdf:resource=”http://www.natoine.fr/wordpress/index.php?sioc_type=post&amp;sioc_id=401″/>
</sioc:Post>
</annotea:body>
<annotea:context>
http://www.jeanSallantin.fr/homepage#xpointer(id(”Main”)/p[2])
</annotea:context>
</annotea:Annotation>
</rdf:RDF>

Nous ne développons pas dans cet article de blog le cas des annotations de type Tag. Il existe actuellement plusieurs solutions pour représenter les tags.

Par exemple, s’il s’agit d’un domaine auquel la ressource fait référence, on peut utiliser la propriété topic de SIOC, on peut aussi dans ce cas utiliser la classe Concept de SKOS, il est possible de désambiguïser le sens d’un tag en faisant référence à une définition de wikipédia en passant par l’ontologie MOAT. Enfin, il existe un vocabulaire Nice Tag Ontology permettant de préciser le sens d’une action de tagging.

A ce sujet, je vous recommande de suivre les travaux de Freddy Limpens et Alexandre Monnin. Nous sommes encore en train de travailler sur l’utilisation des résultats de ces travaux dans notre contexte.

Ce qu’il manque !!!

Nous venons de voir plusieurs données qu’il est essentiel de représenter pour des débats en ligne. Cependant, il en manque encore.

En particulier, il n’est pas encore possible de représenter une opinion ou de typer un Post (c’est un contre-argument, une conclusion, …). Et ceci est central comme exposé précédemment. Le travail du VoCamp à Paris donne pas mal de pointeurs sur ce sujet, notamment des vocabulaires comme ARGDF. Enfin, les travaux sur NiceTag sont trés prometteurs à ce sujet. Cependant, NiceTag se concentre essentiellement sur le sens de l’activité de tagging et non sur l’activité d’annoter. Il est possible de dire qu’un tag exprime un désaccord en spécialisant la relation nt:isRelatedTo. Mais il n’est pas encore possible de dire qu’une annotation discursive exprime un désaccord.

Pour l’instant j’entrevois deux possibilités :

  • soit on ajoute dans le corps d’une annotation une action de tagging exprimant le désaccord. Mais ceci créera une redondance d’information. Une action de tagging lie la ressource taggée à la ressource représentant le tag par la propriété isRelatedTo. Il faudrait donc répéter l’information de quelle ressource est taggée alors que celle-ci est déjà exprimée par la propriété annotates de l’annotation.
  • soit les vocabulaires NiceTag et Annotea évoluent. Pour ma part je considére qu’une action de tagging est un cas particulier d’une action d’annotation. Il me semble qu’alors la propriété isRelatedTo est une propriété inverse et plus spécialisée de la relation annotates … Piste à suivre ;)

Il n’existe pas à ma connaissance de vocabulaire définissant une classe Debate.

Je n’ai pas présenté de solutions permettant de représenter les groupes d’opinion ou stakeholders (parties prenantes). Il est sûrement possible d’utiliser des notions de groupes comme celles présentées dans FOAF. Dans ces groupes, il serait sûrement intéressant de représenter les rôles de chacun. Ceci pose la question de la légitimité de la prise de parole au nom d’un groupe. Est-ce que n’importe qui membre d’un groupe s’exprime nécessairement au nom de ce groupe ?

Enfin, je ne discute pas de la nature des ressources (ce qui est identifié par une URI). C’est à dire que je ne discute pas du fait qu’une ressource soit accessible par le web ou non (voir l’ontologie IRW à ce sujet). Du coup, il serait intéressant de se demander ce que peut être une annotation sur une ressource comme la tour eiffel par exemple (la tour eiffel a une URI, donc est une ressource, mais n’est pas accessible par le web).

Bien entendu le travail de représentation des débats n’est pas fini. Ce que je propose ici est l’utilisation de vocabulaires existant pour une représentation de l’activité d’un réseau social au cours d’une discussion. Je m’appuie beaucoup sur les propositions de A.Passant dans sa thèse. Essentiellement, je n’ai fait qu’ajouter le lien entre les annotations d’Annotea et les Post de SIOC.

Dynamique des débats 2.0

Mardi 13 avril 2010

Ma dernière présentation sur les débats web.

Je positionne mes travaux dans un contexte web-social-sémantique. La présentation était accompagnée d’une démo d’un ensemble de portlets permettant de faire des annotations discursives et sémantiques.

un bel exemple de démocratie

Jeudi 7 janvier 2010

Action discrète s’invite à un débat sur l’identité nationale.
Un bel exemple de ce que peut devenir un débat public…


Action Discrète : Hommage à Mario
envoyé par Gameblog. - Regardez les tests, les trailers et les solutions complètes de jeux vidéo.

Nouvelles formes d’interactions dans les outils de réseaux sociaux

Vendredi 11 décembre 2009

Je vous livre la présentation que je n’ai pas fait aujourd’hui au cours de notre séminaire d’équipe qui n’a pas eu lieu. Mes camarades d’équipes étant trop pris par la rédaction d’articles pour ce soir…
Je leur en veux pas, je comprends. Ce n’est que remis à la prochaine. Et puis j’ai déjà fait cette présentation il y a deux jours dans une société rencontrée lors du digiworld.

L’idée de cette présentation était de montrer que si on pense à une application pour le débat public sur internet, on est obligé de prendre en compte une forte composante sociale.
Le débat peut-être décomposé en 4 axes :

  • Les participants
  • L’information
  • La discussion
  • La prise de décision

Et dans ces 4 axes, la question de QUI agit est prédominante.

  • Qui participe?
  • Qui crée l’information?
  • Qui discute avec qui?
  • Qui prend les décisions?

Ensuite, j’ai repris les idées de réseau ancré dans le réel et d’interactions centrées objets. Ce qui me permet de faire un petit point critique sur les outils de réseau actuels.

J’ai piqué pas mal d’images (slides n° : 6-7-8-11-12) à Fabien Gandon, piochées dans sa présentation web sémantique et web social.

TER 2009-2010 Environnement Virtuel et débat public

Dimanche 22 novembre 2009

Sujet de TER proposé par Nancy Rodriguez auquel je suis associé comme co-encadrant.

Les environnements virtuels peuvent-ils acueillir des débat ?
Dans le cadre du projet InterMed, nous nous intéressons aux sites participatifs de débat pour lesquels, à l’heure actuelle, l’interface est principalement textuelle.
Dans ce TER nous souhaitons étudier les possibilités offertes par les environnements virtuels (EV) pour tenir un débat. Comme indiqué dans (1), “la vie oscille entre les modes physique et virtuel”…est-il donc possible pour les habitants d’un EV de s’informer, interagir et débattre dans leur mode virtuel ?

(1) http://commposite.org/v1/99.1/articles/abramson.htm

CST première année

Mardi 17 novembre 2009

Et voilà, première année finie. Je vous livre tel qu’il a été présenté lors de mon Comité de Suivi de Thèse le rapport de mon travail de première année.

Intitulé de la thèse : Visualisation d’interactions entre acteurs et agents dans le cadre des débats publics

Le débat public

Le débat public est avant tout un moyen de réduire les incertitudes.
[Caillon et al, 2002] « Comme les spécialistes n’ont pas de réponses définitives et robustes aux questions que se posent ces groupes, et comme par ailleurs les hommes politiques sont désarmés devant ce foisonnement de prises de parole inattendues et changeantes, les institutions craquent de tous les côtés. La seule solution est d’accueillir ces groupes concernés et de tenir compte de leurs demandes. Un débat public digne de ce nom doit organiser cet accueil et faciliter la réduction des incertitudes. »
La réduction des incertitudes passe par l’information des citoyens et la co-construction d’un savoir par les groupes concernés. [Caillon et al, 2002] «il faut abandonner la facile opposition entre ceux qui savent et ceux qui ne savent pas, pour accepter la notion de groupe concerné et pour reconnaître à ces groupes la capacité de co-produire les savoirs qui leur sont destinés. »
Cette réduction d’incertitude et cette création de savoir sont d’ailleurs moteurs de la dynamique des débats. [qu'en pensent les citoyens] « Au fur et à mesure que les savoirs réduisent les incertitudes, de nouvelles options émergent, qui suscitent de nouvelles inquiétudes. Des groupes concernés disparaissent ou se transforment en groupes de pression, d’autres réapparaissent et relancent la recherche.»
[Vedel, 2003] associe trois axes au débat :

  • l’axe de l’information « pour prendre de bonnes décisions et participer à part entière au processus démocratique, les citoyens doivent être complètement informés. »
  • l’axe de la discussion « L’internet est vu comme un instrument permettant de stimuler et d’enrichir la discussion entre citoyens. (…) la création d’un espace public vigoureux et ouvert, à même d’accueillir l’expression d’idées multiples et de demandes qui ne peuvent se manifester dans le cadre institutionnel et rigide de la démocratie représentative »
  • l’axe de la décision « de la consultation ponctuelle des citoyens à leur intervention directe dans le processus de décision. (…) [Internet] ne serait pas seulement un moyen de communication commode entre gouvernants et gouvernés, mais créerait un canal d’expression civique qui modifierait le rapport de forces entre gouvernants et gouvernés. »

Sans ces trois axes, il n’y a pas de débat pour Vedel : « Multiplier les sources d’information n’accroît pas les capacités cognitives des individus. Fluidifier la circulation de l’information ne crée pas la transparence tant que l’opacité reste une ressource stratégique. Discuter entre citoyens du monde n’est qu’un agréable échange si l’on ne sait pas construire une décision collective. »
Nous proposons la définition suivante :
Un débat public est une discussion entre citoyens informés portant sur une question dont l’issue n’est pas certaine et dont l’objectif est de prendre des décisions.

Le débat sur internet

Peut-on considérer alors que le débat existe déjà sur internet?
Internet est le moyen de communication à plus large canal. Dés le début il a été possible de visionner des documents et de les éditer. Très rapidement ont été mis en place des solutions de discussions mail et IRC. Internet permet à n utilisateurs de communiquer avec n utilisateurs. En comparaison, le téléphone est un mode de communication 1 1, la télévision un mode de communication 1 n.
Et c’est encore plus vrai avec le web 2.0. C’est le web de l’interaction, le web collaboratif, le web participatif, le web social. L’utilisateur est au cœur de la production de données grâce à des outils simples d’usage comme les blogs, les forums, les wikis…
[Price, 2006] considère qu’internet va beaucoup apporter aux débats publics :

  • Bien que peu importants en nombre et en qualité, les discussions en ligne sont de plus en plus utilisées par les citoyens. Signe d’acceptation de l’outil internet dans ce contexte.
  • Des groupes peuvent interagir (interaction interne au groupe et externe entre groupes) malgré des contraintes de distances géographiques.
  • Les coûts de mise en place sont réduits.
  • La visibilité est fortement augmentée.

Mais est-ce suffisant? Ce n’est pas parce que des citoyens peuvent discuter en ligne de problèmes de société que l’on peut considérer qu’il y a débat public.
On retrouve aussi chez [Fung, 2006] l’importance du lien entre la discussion et la décision. Il mesure la qualité du débat en fonction de trois axes dont l’un est l’impact des discussions des citoyens sur la décision des gouvernants. Les deux autres étant d’un côté les participants du débat (comment ils sont sélectionnés et qui sont-ils), de l’autre les modes de communication et de prise de décision (parole libre pour tous, exposés de quelques uns, vote, …).
De plus, internet tel qu’il est aujourd’hui apporte aussi son lot de problèmes. Le web 2.0 apporte une simplicité d’usage mais aussi la profusion de sources d’informations. Trouver la bonne information devient une activité à part entière. Comme le souligne [Vedel, 2003] « les citoyens sont plutôt des animaux politiques paresseux qui s’efforcent d’économiser leur énergie : une grande part de leur activité consiste non pas à rechercher plus d’information mais à mettre en œuvre des procédés pour filtrer, réduire et gérer l’information surabondante qu’ils reçoivent ». Grâce au web 2.0, tout le monde peut exprimer son avis, et tout le monde l’exprime dans son coin (son blog personnel, le forum de sa communauté, sa page facebook,…). Face à cette masse de données, être correctement informé devient un challenge en soi dans le contexte du web2.0.
Les systèmes de syndication ont apporté un début de solution à ce problème et une initiative comme le projet LinkingOpenData* montre que le web 2.0 peut tirer profit du web sémantique pour devenir le véritable web des données. Un web qui ressemblerait de plus en plus à ce qu’imaginait [Bush, 1945] avec le Memex, un moyen de partager des connaissances, de les recommander et de les lier les unes aux autres.

Le réseau du débat

Notre approche du débat se concentre essentiellement sur l’aspect réseau, réseau social entre les acteurs du débat mais aussi réseau entre les objets du débat, les arguments, les documents, des lieux, des thèmes,…
Nous définissons le réseau des débats comme étant un réseau hétérogène, c’est à dire un réseau reliant des objets de types différents avec des relations de types différents. Les nœuds du réseau pouvant être de natures différentes (citoyens, sujets, débats, arguments, rôles, documents,…). Les relations du réseau pouvant être de natures différentes et orientées (ami, collègue, est_auteur, a_commenté, est_sous_débat…).
Cependant, un tel réseau pose des problèmes d’analyse. En SNA (Social Network Analysis), la plupart des réseaux considérés sont homogènes (un seul type d’objets) et mono-relationnels. Et les métriques proposées n’ont de sens que pour ce type de réseaux.
Dans [White, 2008], Harrisson C. White considère qu’à un individu est associé une multitude de réseaux dépendant des domaines de compétences ou des centres d’intérêt de l’individu et des relations qu’il entretient avec d’autres individus dans ces domaines. Il nomme cet objet « réseau-domaine » un NetDom (pour Network and Domain). L’individu est alors en permanence en train de changer («switch») de NetDom. Quand White tente de schématiser cet ensemble de réseaux, il dessine un ensemble de plans parallèles, chaque plan étant le support d’un graphe de relations entre les individus. En quelque sorte, White montre qu’un réseau social multi-relationnel peut être décomposé en un ensemble de réseaux mono-relationnels.
Dans [Ferrand, 2007] et [Nadel, 1970], les relations entre les individus sont fortement liées à la notion de rôles. Et, « toute relation ainsi identifiée est censée signifier toute la série de comportements qu’elle subsume. Ainsi, l’”amitié” se manifeste à propos de modes d’action divers, saisissables en des occasions aussi différentes que l’entraide dans les périodes de crise, l’échange de conseils, le plaisir d’être ensemble et certaines réactions affectives particulières. » Dans notre cas, les objets de notre réseau sont soit des individus (acteurs jouant des rôles), soit les vecteurs d’interaction entre ces acteurs. Ce deuxième type d’objet permet donc de mettre en évidence des comportements entre acteurs.
Pour l’assistance et les visualisations dans le cadre des débats, nous nous appuierons sur l’analyse du réseau. Que celui-ci soit mono-relationnel et homogène ou hétérogène et multi-relationnel, qu’il soit considéré comme complet ou personnel (centré sur un individu).

Problématiques

Dans le domaine des débats électroniques, les problématiques suivantes ont été relevées sur lesquelles nous pensons qu’une analyse du réseau peut-être la base d’une solution  :

  • L’accès aux informations.

[Vedel, 2003] «pour prendre de bonnes décisions et participer à part entière au processus démocratique, les citoyens doivent être complètement informés.» « pour être parfaitement éclairé, le citoyen a besoin d’information mais aussi d’information sur l’information. » «les citoyens sont plutôt des animaux politiques paresseux qui s’efforcent d’économiser leur énergie : une grande part de leur activité consiste non pas à rechercher plus d’information mais à mettre en œuvre des procédés pour filtrer, réduire et gérer l’information surabondante qu’ils reçoivent. » Dans [Caillon et al, 2002] , les auteurs insistent sur l’objectif de formation des débats. Un débat doit lever des incertitudes et cela passe par la formation, l’éducation des citoyens. C’est particulièrement vrai quand il est question de sciences et de technologies. Les experts se doivent de transmettre ce qu’ils savent mais ne doivent pas considérer qu’ils détiennent l’unique vérité. « il faut abandonner la facile opposition entre ceux qui savent et ceux qui ne savent pas, pour accepter la notion de groupe concerné et pour reconnaître à ces groupes la capacité de co-produire les savoirs qui leur sont destinés. »

  • La polarisation des opinions dans les débats.

[Price, 2006] craint que sur internet le risque que les discussions créent une polarisation des opinions ne soit encore plus présent. En discutant toujours avec les mêmes personnes, les gens ont tendance à adopter la même position et à se radicaliser. Un débat entre personnes ayant tous la même opinion n’est plus un débat. [Sen, 2005] «L’idéal du débat public est étroitement lié à deux pratiques sociales bien spécifiques qui méritent une attention toute particulière: la tolérance à l’égard de points de vue différents (y compris le fait de se trouver d’accord pour être en désaccord) et l’encouragement au débat public (y compris au fait d’adhérer à l’idée qu’il peut y avoir enrichissement et enseignement réciproques).» [Granovetter, 1973] considère qu’un groupe de personnes reliés par des liens forts vont avoir tendance à renforcer leurs opinions communes. Il préconise l’utilisation des liens faibles comme moyen d’ouverture du groupe en prenant en compte des points du vues différents car émis par des gens ayant accès à d’autres informations.

  • Détecter et aider les groupes d’opinions émergents

[Caillon et al, 2002] « Au fur et à mesure que les savoirs réduisent les incertitudes, de nouvelles options émergent, qui suscitent de nouvelles inquiétudes. Des groupes concernés disparaissent ou se transforment en groupes de pression, d’autres réapparaissent et relancent la recherche. Cette dynamique est centrale, car c’est d’elle que dépend la possibilité d’aboutir à des solutions satisfaisantes et de construire un monde commun dans lequel des identités multiples et différentes coexistent. » Les groupes émergents sont particulièrement importants car ils sont désorganisés et peu nombreux par rapport aux groupes déjà constitués et ils sont les représentants des nouvelles tendances dans le débat.
Nous exprimons ces trois problématiques de la façon suivante :

Identité, rôles et communautés

Dans les travaux de Fanny George [Georges, 2009], l’identité numérique est fortement définie par l’activité de l’individu au sein de son réseau. [Passant, 2009] s’appuie sur les ontologies FOAF* et SIOC* pour représenter l’individu et son réseau, mais aussi son activité dans une communauté. La définition de communauté chez A Passant vient de [Breslin et Decker, 2007], c’est un ensemble d’utilisateurs constituant un réseau autour d’objets particuliers (object centered sociality) indicateurs de centres d’intérêts communs.
Dans [Ferrand, 2007] et [Nadel, 1970], une communauté est structurée par un ensemble de normes représentées par des rôles et les comportements qu’ils impliquent.
Notre premier problème est donc, si l’on veut pouvoir correctement étudier la structure d’une communauté, de pouvoir prendre en compte, dans la définition de l’identité les rôles existants, les comportements qu’ils impliquent et les transgressions qui sont faites (c’est par ces transgressions que les définitions des rôles peuvent être amenées à changer).

Force des liens relationnels

[Granovetter, 1973] définit la notion de « liens forts, liens faibles ». C’est une mesure de la « force » d’une relation entre deux individus basée sur quatre quantités : le temps passé, l’intensité émotionnelle, le degré d’intimité, le nombre et l’importance des services rendus. Un groupe d’amis a donc tendance à être un ensemble de personnes liées par des liens forts. Granovetter estime que deux amis ayant un lien fort ont de fortes probabilités d’entretenir les mêmes relations envers les autres individus du réseau. Leurs réseaux personnels ont tendance à être identiques. Il considère alors que si l’on veut rapidement propager une information à un grand nombre de personnes, il faut la communiquer via ses liens faibles. Ainsi, l’information transite de groupes en groupes. Une information transmise via un lien fort ne va atteindre que les personnes d’un même groupe et risque d’être répétée dans le groupe. Autre intérêt des liens faibles, ils sont l’occasion de connaître des personnes évoluant dans d’autres groupes et donc ayant des connaissances et des opinions différentes.
Notre deuxième problème est donc d’être capable dans un réseau de caractériser des liens forts et des liens faibles. Nous considérons pour cela que les outils du web social actuel permettent de qualifier les relations de fortes ou faibles en fonction de données quantitatives (telles que le nombre de messages échangées, la fréquence, le nombre de photos partagés, le nombre de groupes partagés,…) mais aussi en se basant sur la sémantique des relations déclarées par les individus (amis facebook, collègues linkedin, anciens camarades de classe copains d’avant,…).

Argumentation

Toujours dans un contexte de débat, les outils de web2.0 actuels permettent de discuter entre utilisateurs. La plupart du temps, ils permettent d’émettre des commentaires libres et donc d’exprimer toute sorte d’opinion. L’ontologie SIOC permet très bien de représenter ce genre de relations (u1 a ajouté un commentaire à l’article du blog de u2, u1 a répondu au topic de u2, …). Mais SIOC est incapable de représenter que « u1 s’est opposé à l’argument de u2 via sa réponse». Et nous ne connaissons pas d’ontologies web actuellement capable de représenter ce genre de relations. En fait, nous ne connaissons pas d’outils web2.0 permettant de déclarer « je vais m’opposer » ou « je vais soutenir » l’argument de cet autre utilisateur. Souvent, cette information s’exprime par le biais d’un système de vote, mais il est rare que le vote ait à être justifié. Et quand bien même, un débat ne s’arrête pas à des arguments pour et contre. Un véritable argumentaire est fait d’exemples, de propositions, de témoignages, de démonstrations (c’est à dire d’énoncé ayant valeurs de preuves ou de contre-exemples)… Un argumentaire est constitué de nombreux actes de langages. Si le web 2.0, en ayant fait le choix de la simplicité d’utilisation, laisse bien la possibilité aux utilisateurs d’exprimer tous les actes de langages qu’ils souhaitent librement, il pose aussi le problème de l’interprétation de ces actes de langage. Un message dans un certain contexte peut très bien paraître comme un compliment alors qu’en réalité il est ironique. Et suivre un débat à grande échelle dans ce contexte nous paraît impossible. Cela demanderait à relire l’intégralité des arguments pour avoir une vue d’ensemble de l’argumentaire.
C’est notre troisième problème, comment représenter les différents actes de langages nécessaires à la construction d’argumentations et comment permettre aux utilisateurs de les exprimer sans que l’utilisation s’éloigne trop du principe de simplicité d’usage du web 2.0.

Méthodes employées

Nous proposons trois méthodes d’analyse du réseau des débats:

Analyse de la structure sociale

Caractériser dans le réseau l’existence de structures sociales [Nadel, 1970] « la structure d’une société s’obtient par une opération d’abstraction à partir des personnes concrètes et de leurs comportements; cette abstraction permet de construire le modèle, le réseau (ou le système) de relations qui s’institue “entre des acteurs envisagés dans leur aptitude à jouer des rôles à l’égard les uns des autres” ».
Nous nous intéresserons donc principalement aux fonctions, comportements subsumés par les rôles. Nous rechercherons des patterns, des graphes de relations entre rôles récurrents dans les graphes des débats.

Analyse des liens forts-faibles

Caractériser l’intensité des relations entre les individus en se basant sur les notions de liens forts et liens faibles. Pour se faire, nous étudierons les relations déclarées entre les individus (je suis ami de, marié avec, …) et les interactions entre ceux-ci par le biais d’autres objets du débat (par cette argument je m’oppose à, j’ai lu le même document que, je m’intéresse aux mêmes sujets que,…).

Ontologie de l’argumentation, oppositions entre actes de langages

Définir une ontologie de l’argumentation par laquelle nous pourrons représenter des oppositions entre les arguments et analyser les échanges argumentatifs entre les individus.

Expérimentations

Nous présentons ici trois protocoles d’expérimentation permettant de récupérer les données nécessaires à la mise en place de nos méthodes d’analyse:

Moissonnage de données sociales

Le premier protocole consiste à s’appuyer sur un moissonnage de données provenant de plateformes existantes de réseaux sociaux comme facebook, myspace ou twitter dont les APIs permettent de facilement interroger les données utilisateurs. Nous allons ainsi représenter le réseau d’un utilisateur dans le prolongement de [Georges et al, 2009].
Nous pensons que les plateformes web de réseaux sociaux vont tendre vers des formats d’échange de données afin de permettre aux utilisateurs de n’avoir plus qu’un seul compte utilisateur sur le web. Cette idée est présentée dans [Passant, 2009], elle repose sur l’utilisation de FOAF et OpenID*. A Passant présente même dans [Passant et al, 2009] une vision ou la gestion des droits d’accès aux données d’un utilisateur serait intimement liée à la gestion de son réseau.
Ce protocole expérimental ne nécessite pas de réunir un groupe d’utilisateur. Nous nous reposons uniquement sur l’utilisation d’applications permettant de moissonner des données d’utilisateurs sur les différents outils de réseaux sociaux qu’ils utilisent.

Utilisation d’outils de discussions

Le deuxième protocole expérimental consiste à faire discuter un ensemble d’utilisateurs durant une séance sur un sujet à partir d’un ensemble de documents de référence.
La reproduction de ce protocole repose sur l’utilisation de différents textes et outils de discussions (forum, annotation, environnement « second life », …).
Nous évaluons ensuite la qualité des argumentations et nous typons avec les utilisateurs les actes de langage qu’ils ont utilisé.
Ensuite, nous essayons de proposer des « templates » de saisies des arguments correspondant aux types d’actes de langage définis. Nous essayons donc de modifier les interfaces de saisies des outils afin d’introduire de la sémantique interprétable par des agents logiciels.
Ce type d’expérimentation correspond à l’expérimentation nanotechnologie menée cette année.

Tagging

Le troisième protocole repose essentiellement sur l’utilisation du tagging.
Nous cherchons à détecter des communautés à partir des ressources autour desquelles elles se rassemblent.
Pour ce faire, nous proposons aux utilisateurs d’utiliser l’annotation ou le tagging, à la façon des outils de bookmarking social comme delicious* ou diigo*, afin de signaler le domaine d’une ressource. Ainsi nous savons ce qui intéresse les utilisateurs et à quels domaines ils rattachent ces ressources.
Nous avions tenté lors du stage de Master 2 et durant le congrès ECAP08 de faire tagger des textes à nos utilisateurs en même temps qu’ils pouvaient annoter celui-ci.

Technologies employées

Au cours de cette première année nous avons utilisé plusieurs technologies afin de mettre rapidement en place nos premières expérimentations. Le premier besoin était de disposer de données provenant de discussions. Nous avions fait le choix d’utiliser l’annotation comme moyen de discussion. Pour cette nouvelle année, l’annotation va être expérimentalement comparée à d’autres solutions (forums, blogs, second life,…). Cependant, nous discuterons ici des choix  technologiques qui ont été fait concernant l’annotation.
Durant le stage de Master 2, nous avions greffé une solution d’annotation non aboutie dans le CMS SPIP* en php.
Suite au stage de Master 2, nous avions cette fois utilisé la plateforme Xwiki* pour greffer l’annotation. Le core de Xwiki est en Java et utilise les langages de script Velocity et Groovy pour la partie web.
Ces deux solutions nous ont semblé dans un contexte de prototypage rapide. Nous pouvions profiter des autres fonctionnalités des plateformes sans avoir à les développer. Cependant, le rapport des fonctionnalités nécessaires à nos expérimentations sur le nombre de fonctionnalités proposées par ces plateformes est très faible (plus élevé dans le cas de Xwiki). Ensuite, l’intégration de l’annotation a à chaque fois été un véritable défi. Il a fallut se ré-approprier un environnement certes libre, mais dont le code était peu documenté. De plus, ces solutions limitent l’utilisation de l’annotation et donc des discussions au cadre de la plateforme contenant. Ce choix peut être judicieux, après tout le projet Intermed doit au final proposer une plateforme. Mais peut aussi paraître contraignant si on aspire à un débat plus ouvert sur le web.
L’autre solution que nous avons mis en place avait quand à elle cet avantage de permettre de débattre à partir de n’importe quelle ressource du web. Nous nous étions basé sur le protocole Annotea* du W3C et avions développé un plugin pour Firefox à partir du plugin Annozilla* déjà existant. Le protocole Annotea est un protocole de communication client-serveur basé sur le protocole HTTP. Il permet à un serveur de stocker des annotations provenant de clients respectant le protocole de communication. Les annotations doivent pouvoir être récupérées selon un format RDF. Le plugin Annozilla développé en javascript permet de transformer le navigateur Firefox d’un utilisateur en un client d’annotation. Le protocole Annotea n’a pas eu à évoluer depuis 2001, et de nombreux projets reposent sur ce protocole, notamment concernant l’annotation de ressources vidéos. Cette solution paraît être la plus pérenne. Annotea restant le protocole de référence dans ce domaine. De plus, le format RDF permet d’envisager de multiples évolutions sémantiques concernant les annotations, ce qui correspond à nos besoins d’ontologie de l’argumentation. Cependant, le développement de clients adaptés à tous les navigateurs reste un développement couteux en temps, ce qui ne correspond pas à nos besoins de prototypage rapide. Et nous avons dans Intermed un besoin de gestion des documents de départ. Dans une telle solution, cela veut dire que la gestion des documents est totalement détachée de la gestion des annotations. Les documents peuvent alors être édités et stockés dans un wiki comme ce fut le cas au cours des débats nanotechnologie ou bien être stockés dans n’importe quel autre site. Par exemple, le blog du débat sur les nanotechnologies est annotable comme toute autre page web. Pour les premières expérimentations Intermed, nous avions développé un portlet de gestion des débats permettant notamment d’uploader des documents HTML. La technologie portlet nous semble être un choix pertinent concernant la création d’une plateforme de débat intégrant de multiples fonctionnalités. Surtout que les meilleurs portlets containers actuels permettent tout comme les CMS de créer plusieurs sites web à partir d’un même serveur d’application et de paramétrer les fonctionnalités offertes par les portlets en fonction des différents sites. Cependant, le développement de portlets a un cout non négligeable et peut-être non adapté à un prototypage rapide.
La dernière alternative concernant l’annotation est l’intégration d’une autre plateforme dont nous maîtrisons la relation avec les développeurs afin de faire de celle-ci un client Annotea. Wybo Wiersma est venu au LIRMM une semaine afin de nous aider à prendre en main sa plateforme LogiLogi*. L’annotation y est déjà intégrée ainsi que des fonctionnalités de base d’un forum et des fonctionnalités plus avancées (réponse à de multiples messages, tagging, gestion de groupes, profils OpenID). Cette solution nous semble la plus pertinente dans une optique de prototypage rapide et d’expérimentations à faible durée. Mais nous considérons cette solution comme contraignante en terme d’ouverture des débats sur le web en général.
Il reste que dans notre vision d’un débat ouvert sur le web, ou n’importe quelle ressource peut devenir un élément de débat, il restera nécessaire d’avoir une interface permettant d’avoir une vue globale sur les débats. Une sorte de portail web permettant de centraliser toutes les informations relatives aux débats en cours, que les discussions aient lieu dans un blog, un wiki, un forum, un espace 3D, un channel IRC, …

Bibliographie

[Breslin et Decker, 2007] The Future of Social Networks on the internet : The need for Semantic, John G.
Breslin et Stefan Decker, dans IEEE Internet Computins, 11(6):86-90. 2007.
[Bush, 1945] Vannevar Bush (1945). As We May Think. The Atlantic Monthly, 176(1):101–108.
[Caillon et al, 2002] Qu’en pensent les citoyens ? Michel Caillon, Yannick Barthe et Pierre Lascoumes paru
dans le magazine Sciences humaines n°124 Février 2002 Rubrique Société du risque : fantasmes et réalité.
[Ferrand, 2007] Confidents – une analyse structurale de réseaux sociaux, Alexis Ferrand, L’harmattan (eds.)
collection Logiques sociales. Juin 2007.
[Fung, 2006] Varieties of Participation in Complex Governance, Archon Fung, dans Public Administation
Review, Volume 66, Supplement 1, December 2006 , pp. 66-75(10), Blackwell Publishing.
[Georges, 2009 ] Représentation de soi et identité numérique: analyse sémiotique et quantitative de
l’emprise culturelle du web 2.0., Fanny Georges, dans Réseaux: Usages du Web 2.O, Vol. 27 154. Paris : La
découverte, avril 2009.
[Georges et al, 2009] Sémiotique et visualisation de l’identité numérique: une étude comparée de Facebook
et Myspace. Fanny Georges, Antoine Seilles, Guillaume Artignan, Bérenger Arnaud, Nancy Rodriguez,
Mountaz Hascoët, Jean Sallantin. Article soumis en vue de la publication dans les actes de la conférence
internationale Hypermedias, Hypertexts, products, tools and methods 2009 (H2PTM’09): Rétrospective et
Perspective 1989 - 2009. Paris : Hermès. À paraître en 2009.
[Granovetter, 1973] The Strength of Weak Ties, Mark S. Granovetter dans American Journal of Sociology,
Volume 78, Issue 6, 1360-1380. Mai 1973.
[Nadel, 1970] La théorie de la structure sociale, Siegfried F Nadel, Paris, Éditions de Minuit. 1970.
Traduction de The Theory of Social Structure, London, Cohen et West. 1957
[Passant, 2009] Technologies du web sémantique pour l’entreprise 2.0, Alexandre Passant, Manuscrit de
thèse soutenue à l’Université Paris IV, Juin 2009.
[Passant et al, 2009] Enabling Trust and Privacy on the Social Web, Alexandre Passant, Philipp Kärger,
Michael Hausenblas, Daniel Olmedilla, Axel Polleres et Stefan Decker, dans W3C Workshop on the Future
of Social Networking. Janvier 2009.
[Price, 2006] Citizen Deliberating Online : Theory and some Evidence Vincent Price, dans T.Davies et
B.S.Noveck (eds.), Online Deliberation : Research and Practice, Chicago : Chicago University Press. 2006
[Sallantin, Seilles 2009] N-Opposition Theory to Structure Debates, Jean Sallantin et Antoine Seilles. Dans
New perspectives on the square of opposition, Jean-Yves Beziau (à paraître). 2009.
[Sen, 2005] La démocratie des autres – Pourquoi la liberté n’est pas une invention de l’occident, Amartya
Sen, Payot (eds.). 2005
[Vedel, 2003] L’idée de démocratie électronique : origines, visions, questions Thierry Vedel, dans Pascal
Perrineau (dir.), Le désenchantement démocratique, La Tour d’Aigues, Éditions de l’Aube. 2003
[White, 2008] Identity and control : how social formations emerge, 2nd edition, Harrisson C. White, Princeton
University Press. Mai 2008.
Annotea : http://www.w3.org/2001/Annotea/
Annozilla : http://annozilla.mozdev.org/
Copains d’avant : http://copainsdavant.linternaute.com/
Delicious : http://delicious.com/
Diigo : http://www.diigo.com
Facebook : http://www.facebook.com/
FOAF : http://rdfweb.org/foaf/
Linkedin : http://www.linkedin.com/
LinkingOpenData : http://esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/LinkingOpenData/
OpenID : http://openid.net/
SIOC : http://sioc-project.org/
SPIP : http://www.spip.net/
Xwiki : http://www.xwiki.com

Osidmesh

Vendredi 23 octobre 2009

Une journée organisée au labo pour faire se rencontrer les Sciences Humaines et Sociales et l’informatique.
C’est la journée Osidmesh pour être aussi de méche ;)

Fatalement avec des thèses pluridisciplinaires à cheval entre SHS et informatique on ne pouvait que participer.
“On”, c’est Julien Cotret et moi. Et nos deux thèses sur la dynamique des débats publics sur internet.
Et puis on (les organisateurs de la journée cette fois), nous avait dit que les gens de SHS souhaitaient qu’on leur présente des outils pour faire des sondages d’opinion en ligne. Alors fatalement, nous on leur a parlé de Facebook, des blogs…

Déjà, c’est quoi une opinion? C’est un acte discursif où l’énonciateur “modalise” explicitement ou implicitement l’objet de son énonciation avec les dimensions “possible/impossible”, “souhaitable/non souhaitable”, “beau/laid”, “agréable/désagréable”, etc. [Chabrol & Bromberg, 1999]

Et puis, soyons sérieux, les enquêtes d’opinion c’est bien mais ça a plein de limites.
Ca passe trés bien à l’échelle, les résultats sont facilement traitables mais par contre ça ne fournit qu’un instantané de l’opinion des gens et puis c’est fortement biaisé par les auteurs du questionnaire et par la formulation de leurs questions.
Donc y a quoi de mieux? Et bien y a le Web Social. Les facebooks, blogs, forums, twitters et compagnie qui, bien que pas du tout prévus pour ça à la base, permettent à tout le monde de partager son opinion avec son réseau. Et une opinion qui évolue sans cesse du coup. Puisque re-discutée par les autres et donc re-défendue. Bref du débat sur internet.
Bon ok, le traitement des données et beaucoup plus couteux. Il faut se palucher les APIs nécessaires à l’extraction des données, il faut faire du traitement de la langue pour analyser la sémantique des objets d’échange (comprendre interpréter les posts comme des actes de langage), et il y a un certain biais des contenus dû aux interfaces.
D’un autre côté, on gagne des opinions fortement contextualisées, pas du tout pré-définies (chacun dit ce qu’il veut ou presque), et l’utilisateur est pro-actif (s’exprime qui veut).
Alors du coup, qu’est-ce qu’il faudrait faire de mieux? Et bien il faudrait déjà concevoir un outil pour ça, pour l’expression d’opinions. Dans nos tentatives précédentes on a essayé d’introduire un peu de sémantique dans des templates de saisie d’opinions. On a essayé de penser la discussion comme étant centrée autour de textes de départ. On sait pas trés bien encore mais on y travaille, il nous reste deux ans de thèse…

Et puis qu’est-ce qui nous intéresse le plus dans ce sujet :
Pour Julien c’est la partie assistance, pour moi c’est la partie visualisation/cartographie.

Et en guise de conclusion : il est temps de faire (comprendre “concevoir”) du web 2.0 avec des gens de SHS et inversement, faisons des SHS avec des outils web2.0.

Ah et ultime petite remarque, pour les slides sur sarkozy et l’ump. Et bien comment dire, loin de nous l’idée de faire de la propagande mais actuellement, et c’est déplorable, ce sont eux les plus efficaces en terme d’utilisation des outils web 2.0 pour faire de la com.
Il serait temps que les autres s’y mettent !!!