logo OVNI-SCIENCES

RE: [OVNI-SCIENCES] Catalogue - rassemblons ce qui est épars (comme l'eau)

Michael Vaillant michael.vaillant at free.fr
Mer 30 Nov 15:23:03 CET 2005


 

Bonjour la liste,

 

 

 

Je vous encourage à faire votre possible pour travailler ensemble,
rassembler l'existant, vous unir, et ne pas "lâcher le morceau".

 

Cette conversation, me rappelle (hélas) ce dont je/on discutais en début de
l'année avec Christophe  Jérome Beau et Luc chastan : justement, un projet,
censément ouvert, libre et collaboratif de catalogue en ligne. Avec, à la
clé, une discussion qui s'est très vite enlisée dans des échanges techniques
(et non pas dans le "faire") Jérôme Beau a fini par décliner l'invitation de
collaboration, ayant le sentiment que j'empiétais sur ses propres "visions",
et que je souhaitais récupérer ses idées (!): il a préféré continuer dans
son "coin". Je le regrette et je ne jugerai pas de qui a raison ou à tord
dans cette histoire, mais j'ai conservé 20 ou 30 pages de discussion qui
n'ont servi à rien... (si ce n’est peut-être essayer de témoigner de cela -
c’est assez instructif en la matière )

 

Mon sentiment, est que compte tenu de cela, et de certains autres échanges
sur les listes : beaucoup de personnes ont tendance à vouloir tirer la
couverture à eux, les positions souvent sont arrêtées et moins à essayer de
collaborer. Je ne désespère pas d'essayer et dès que je peux voir une amorce
comme celle-ci j’en suis très heureux !

 

Finalement aussi, avec Luc chastan (base ovni France), on va peut-être créer
ensemble un système qui peu ou prou qui communique, sur un site miroir.
Quoiqu’il en soit, ce sera un terrain d’essai commun.

 

En ce sens, je pensais attendre que tout cela soit plus construit pour vous
en toucher un mot, mais avec cette bonne idée qui émerge sur la liste, je
saisis la balle au bond pour essayer d’apporter les éléments que j’ai pu
dégager, et peut-être une occasion d’avancer *ensemble* de la façon la plus
constructive qui soit.

 

Pour ce qui me concerne, je peux donc vous proposer des modèles sur ce
sujet: en effet, j'ai travaillé depuis le début de cette année sur un modèle
collaboratif d'édition en ligne et de saisie des observations UFO dans un
wiki...  

 

Si j’ai eu besoin d’un tel outil, c’est que cela m’était utile et
*nécessaire* pour une étude sur les OVNI, la biosphère et la complexité,
impulsée par Teky et commencée là : www.u-sphere.com
<http://www.u-sphere.com/> . Et de là, la nécessité de disposer d'un grand
nombre de données, pour des études statistiques. Les formats de bases
existants n'étant pas satisfaisants. Pour cette étude, en effet, j'ai besoin
:

- d'un modèle de mesure de la cohérence et de la consistance de
l'information, 

            - d’un maximum d’informations sur l'environnement des
observations. 

 

Et de séparer les contextes dans l'observation. Sans rentrer dans les
détails ici, je vais mettre un modèle d’analyse et dévaluation en ligne (sur
u-sphere ou autre). Comme vous le savez peut-être, j'ai eu l'occasion de
donner des formations en veille et analyse automatique de l'information. Il
y a donc des choses à faire dans ce domaine.

 

Bref, c'est un modèle mixte wiki/BdD que j'encourageais Christophe, Jérôme
et Luc à utiliser. Et d’ailleurs, voir ici, la maquette que j’avais commencé
à construire (que je vais probablement continué à utiliser en enrichir).
Début 2005, avec + de 1000 cas de la base OVNI France (de Luc Chastan :
encore merci !)

 

http://meta.sciences.free.fr/index.php?title=U-Sph%C3%A8re_DB

 

http://meta.sciences.free.fr/index.php?title=UFO:Cases:2A (brouillon)

 

J'ai laissé ça de côté quelques mois. 

 

Plus récemment, le besoin pressant de ces données pour l'étude a fait que
j'ai repris la poursuite de projet de classification et d'analyse
statistique. Ainsi, depuis 1 mois, j'élabore un outil graphique de
cartographie et de visualisation statistique (à impliquer dans le calculs de
corrélations) que je vais coupler aux événements du wiki. Sous forme de
cartes locales aussi.

 

Voir un embryon « manipulable » ici :

 

http://meta.sciences.free.fr/map.php (IE et FF seuls; mes modèles de cartes
sont assez lourds, ce n’est pas forcément très rapide ; j’y ait aussi couplé
des cartes de google). Avec les cas du NUFORC cette fois. Le lien avec la
base ovni France bientôt de Luc Chastan devra être bientôt proposé.

 

Ici, voici tout ce que je projette d’en faire, si cela se passe bien:
http://meta.sciences.free.fr/index.php?title=UMappingTool. 

En réalité, je suis un peu plus avancé que ce que vous pouvez voir. Sur la
v3.1. (en local) j’ai commencé à travailler sur le mapping des trajectoires
de déplacement (+ divers filtres). Déjà, sur les 3000 cas, vous avez un
aperçu de ce que cela donne ( =première approche par mapping automatisé
(=analyse syntaxique) de données non manuellement vérifiées. Trajectoires «
simples »):

http://meta.sciences.free.fr/index.php?title=UMappingTool#Mapping_des_trajec
toires

(et je projette à partir de ce type de schéma, de mapper une carte des zones
de « tension » avec, par km2, des couleurs, selon que les  trajectoires
constatées sont uniformes ou non).

 

Ce premier résultat est encourageant, mais cependant loin d’être
satisfaisant : 

- il ne s’appuie que sur les résumés de cas du NUFORC et pour les «
triangles » seuls (http://www.nuforc.org/webreports/ndxsTriangle.html  ) .
Pratiques, car dépourvus de trop d’informations parasites ; mais
mlaheureusement, souvent les directions (ou successions de changements de
trajectoire) n’apparaissaient pas dans les résumés. Un degré plus fin est
nécessaire. Et, c’est pourquoi je n’ai pas encore mis cela en ligne.

 

Pour être propre et aller plus loin, il est nécessaire en fait, de séparer
les contextes d’information et associer les sources :

 

Comme  les déclarations « exhaustives » des témoins, sont émaillées de «
contextes » (informations qui complètent mais aussi brouillent le message),
il est nécessaire de les différencier. Par exemple, un observateur peut
parler de la couleur d’un avion, ou de la direction dans laquelle ils
roulaient en voiture ; ou alors spéculer sur ce que c’était. Le robot
d’analyse doit savoir séparer ces infos : elles n’ont strictement pas la
même valeur.

 

Donc, je suis parti dans l’écriture d’un petit programme qui détermine
automatiquement les contextes et de façon à pouvoir ensuite lancer les
routines d’analyse automatiques que j’avais faites ; Voilà *pour commencer*
ce que cela donne pour la séparation des contextes :

 

http://meta.sciences.free.fr/index.php?title=UMappingTool#Extraction_des_con
textes_li.C3.A9s_aux_observations

 

Tout cela sera transcrit en php, et sous la forme d’un schéma synthétique
suivant :

(mais aussi de graphe arborescent) :

http://meta.sciences.free.fr/index.php?title=Image:Information_units.gif. 

 

Dans l’exemple sous MS Access, le texte original est en haut à gauche, le
découpage final par « contextes » est donné par les champs de droite,
marqués L0, L1, … Et en bas à gauche, les contextes vus dans le texte, et
les relations internes de hiérarchie basées sur la ponctuation.

 

Ainsi, quand l’ensemble des mots auront été ramenés à des unités de sens
élémentaires, il sera possible de mesurer la qté d’information élémentaire
effective associée à chaque cas. Hors photo, ou autres matériels (L00) qu’il
faudra scanner, mesurer et intégrer.  Voilà pour l’aspect « consistance »
(=qté d’information).

 

Ensuite, pour la « cohérence » (=croisement de l’information): cela devrait
permettre de générer pour chaque rapport une arborescence/ontologie pour la
classification de l’information. Et permettre de comparer strictement les
rapports, éventuellement pour le même cas (= sans subjectivité)).

 

Finalement, « consistance » x « cohérence » + un modèle de circulation de
l’information et de mise en valeur des contextes doit permettre mesurer la
*crédibilité*.

 

A terme, si on le voulait, cela permettrait de fabriquer, un petit crawler
web qui irait chercher automatiquement les cas sur Net, (sans se préoccuper
du fait que le cas existe ou pas) les analyserait et les rentrerait tout
seuls dans la base. Ou bien, complèterait les cas existants (on saurait
facilement croiser deux arbres de données hiérarchiques ; et ça
fonctionnerai bien évidemment pour beaucoup d’autres choses). Avant de
laisser la main à l’homme pour vérification. Mais, je n’en suis pas encore
là… 

 

Mon idée là, est simplement de renseigner à un premier niveau (=rapidement)
la base de d’informations pour la tester. Ensuite, de pouvoir réaliser les
*imparables vérifications manuelles*; avec *évidemment* suivi des
intervenants : les vérificateurs/correcteurs, niveau de crédibilité
personnel, etc. Puisqu’ils participent à la chaîne de diffusion de
l’information, au calcul de la *crédibilité*.  

 

--

Quoiqu’il en soit, pour revenir à cette histoire de catalogue de forme :
vous avez déjà celle qu’a pu dégager le NUFORC(
http://www.nuforc.org/webreports/ndxshape.html ). Mais c’est bien sûr c’est
incomplet, l’outil d’analyse automatique devrait permettre d’en louper
aucune. Un macro-projet là dedans est de vectoriser les schémas pour mesurer
la qté d’information liée à chaque forme et de présenter aux témoins un
catalogue de formes (portraits robots). Vous l’avez compris, une « étoile »
est une forme moins intéressante qu’une « tranche de gruyère volante ».

L’outil d’analyse permet aussi, dans une certaine mesure, de corriger les
cas (par exemple de distinguer « triangles », de « lumières en triangles » ;
il n’y a pas ce degré de finesse là sur les bases du NUFORC).

 

Bref, là je n’ai qu’un seul "credo": faire, faire, faire. Et avancer. 

 

Bref, vous êtes les bienvenus si vous voulez rejoindre ce genre de projet.
Ou bien le fusionner avec ce que vous essayez de faire. Je l’encourage même.


 

Mais je sais que, quoiqu’il se passera, j’avancerai. Et vite. 

 

Amicalement,

 

Michaël

 

-----Message d'origine-----
De : debat-bounces at ovni-sciences.net
[mailto:debat-bounces at ovni-sciences.net] De la part de Gross, Patrick
Envoyé : mercredi 30 novembre 2005 11:51
À : debat at ovni-sciences.net
Objet : RE: [OVNI-SCIENCES] Catalogue

 

 

Désolé, je pensais répondre Lundi mais je n'ai pas pu le faire.

 

Proposition

 

Pour un projet d'étude portant sur les formes décrites dans les rapports
d'observation des objets volants non identifiés.

 

 

1. Ressources

 

Il n'y a probablement pas besoin d'argent, et probablement besoin de gens
qui prennent du temps, et de compétences dans divers domaines.

 

Le projet peut probablement être répartis entre les gens regroupés autour de
tâches clairement définies, du type:

 

- ceux qui s'occupent d'outils informatiques (s'il en faut)

- ceux qui s'occupent de rédiger les hypothèses (voir plus loin)

- ceux qui définissent les structures des données (indices

de fiabilité, format des dates, "classifications", glossaires,

définition des "formes des OVNIS" etc. etc.

- ceux qui récoltent les données (qui "remplissent la base de donnée")

- ceux qui gèrent la "list of issues" (j'expliquerai)

- ceux qui rédigent les papiers avec les réponses aux hypothèses

 

etc ...

 

Cela ne veut pas dire que le travail est cloisonné, les

review devraient être faites pas tous et pratiquement

en continu "pendant la construction."

 

Une des première choses à faire est de rédiger une

liste des tâches.

 

Une chose à faire ensuite est de collecter les bonnes volontés,

et que chacun prenne quelque chose en charge ou participe à

quelque chose de précis. Le workflow, les rôles, sont à définir.

 

2. Déontologie

 

Un code de déontologie doit être fixé. Cela ne doit pas être un roman,

mais un certain nombre de principes doivent être formulées,

communiqués et respectés.

 

Exemples:

 

- Aucune attaque personnelle, seulement les travaux sont soumis à critique,
pas les personnes.

 

- Aucun procès d'intention. Seule la validité des hypothèse est en jeu, pas
des "buts soupçonnés" ou attribués aux participants. Aucun participant n'est
refusé pour des question de position statement.

 

- Jamais de reproches, seulement des demandes.

 

- Aucune fraude dans les données (je sais, cela irait sans dire, mais

c'est mieux quand c'est dit).

 

- Aucun "pillage" des documents et données encore en construction. Quand
quelque chose est fini, tout le monde peut "piller", quand quelqu'un rédige
un document et le met sous révision des autres, ou a fait quelque chose, on
n'en fait pas de plagiat ou de diffusion sauvage.

 

- Aucune critique de la quantité de travail fournie par l'un ou l'autre. Si
un participant ne fait pas grand chose, on l'aide ou on cherche comment il
peut être aidé, et on accepte que les disponibilités des uns et des autres
et les capacités de travail des uns et des autres ne sont pas identiques.

Les parts de travail effectuées par les uns et les autres sont apparentes
dans la documentation (GUP et j'expliquerai). Pas d'émotions. On ne dit pas
"c'est nul", on dit "je voudrais compléter" ou "il y a une erreur ici je
crois". On ne dit pas "ça ne sert à rien" on dit "à quoi ça sert?" etc.

 

- Pas de chef (Mais il faut un coordinateur, un modérateur etc.).

Pas d'arguments d'autorité. Pas de spéculation.

 

- Un langage clair et précis respectant des définitions claires des termes
convenus entre les parties. Par exemple, "OVNI" n'est pas à utiliser pour
remplacer "rapport d'observation d'OVNI" ni pour remplacer "engin
extraterrestre".

 

Les recommandations GUP (j'expliquerai) sont proposées comme base de
travail.

 

2. Formulation des hypothèses

 

Le projet ne doit surtout pas commencer par un remplissage d'une base de
données et des extractions de "résultats".

 

Le projet doit d'abord avoir rédigé ses HYPOTHESES AVANT toute exploitation

de données.

 

Une hypothèse est toujours de la forme:

 

"Si (ceci) alors (cela), sinon (pas cela)."

 

Le projet n'est probablement pas utile à trancher seulement une hypothèse,
au contraire, un grand nombre d'hypothèses peuvent probablement être
rédigées et tranchées à la suite du gros du travail.

 

En français de tous les jours: d'abord, nous devons poser clairement les
questions auxquelles des réponses sont recherchées. En aucun cas il ne
faudrait faire une collection de "cas d'OVNIS" et après faire des simples
comptages du type "30% des OVNIS sont carrés".

 

3. Les données brutes

 

Les données brutes sont nécessairement les rapports d'observations d'OVNI.

 

Il n'est probablement pas possible d'avoir les ressources nécessaires pour
utiliser la totalité des rapports d'observations d'OVNIS comme matériel de
base pour l'étude, ce qui pose un problème: les données retenues doivent
néanmoins être représentatives de la totalité des rapports d'observation
d'OVNIS. Des solutions doivent être trouvées pour garantir au mieux cette
représentativité.

 

Le projet peut néanmoins fonctionner dans un premier temps à partir d'un ou
plusieurs jeux d'essais. Des jeux d'essais modestes mais raisonnablement
représentatifs de la diversité des rapports d'observations d'OVNIS
permettront de définir et entreprendre la formalisation des différentes
phases du projet et de construire et tester les outils et concepts requis.

 

3.1 Constitution ou choix de catalogues

 

Je propose de prendre plusieurs portions temporellement et géographiquement
circonscrites des rapports d'observations d'OVNIS. A titre d'exemple je
propose comme jeux d'essai:

 

- les rapports d'observations d'OVNIs en France du 15 septembre 1954 au 15
octobre 1954 à partir de mon listing. Facile à faire rentrer dans une
structure, documentation déjà largement rassemblée,

 

- le "catalogue Weinstein": peu de cas, ils sont souvent bien connus, facile
à faire rentrer dans uen structure, probablement peu de controverses en
perspective

 

- les airships: prendre une semaine d'airship de 1897. J'ai les données
brutes sous la main, je fais de toute façon les traductions.

 

Rappel: je propose ces exemple comme jeu d'essai, pas en tant que

"représentatifs" ou quoi que ce soit d'autre.

 

3.2 Définitions des données significatives

 

Utiliser GUP, définir, sélectionner, rédiger les explications et modes
d'emploi.

 

Exemple: à priori on peut penser que les "arrêts de moteur de voitures"
n'ont rien à voir avec les "forme de l'OVNI". Mais des hypothèses là-dessus
pourraient être formulées. Il faut, si c'est le cas, savoir comment
formaliser la notion "arrêts de moteur" dans les données brutes. Juste noter
"arrêts de moteur: Oui/Non" peut être totalement insuffisant.

 

3.3 Contraintes portant sur les critères

 

Est-ce qu'un rapport d'OVNI en vaut un autre? Certainement pas. Des indices
bien formalisés doivent être trouvés. Chaque indice doit avoir un poids
dynamique. Si par exemple l'un d'entre nous décide que cela n'a qu'une
petite importance que le témoin ait 10 ans ou 40 ans doit pouvoir diminuer
le poids de ce critère, celui qui pense que c'est très différent si le
témoin à 10 ans ou 40 ans doit pouvoir donner plus du poids à ce critère.
Mais la notion "âge du témoin" est dans tous les cas à ne pas omettre
d'utiliser.

 

Il faut définir les critères de manière complète et fiable.

Le moindre oubli peut réduire fortement ou totalement l'utilité du travail
effectué.

 

4.4 Il y a bien d'autres points. Faire en sorte que le travail sur les
données puisse resservir pour d'autres projets. Faire en sorte que tout soit
vérifiable par des tiers. Les sauvegardes. etc. etc.

 

4. Rédaction

 

La documentation devrait être faite sous GUP. Ma proposition est de vous
montrer ce que cela veut dire au fur et à mesure des besoins, puisque GUP
est en construction. GUP est évidemment révisable, et ce n'est pas un
"carcan", voir GUP comme des moyens de ne pas faire d'erreur, ce n'est pas
autre chose.

 

5. Révisions

 

Avec GUP, les révisions sont clairement notées. Les documents ont un
historique des changements. Les auteurs, les co-auteurs, les reviewers sont
indiqués, les raisons de changements sont données. Les critiques, les
problèmes, les difficultés, sont gérés via une "list of issues" qui évite
les foires d'empoignes.

 

6. Publication

 

6.1 Je propose que les publications ne soient pas commerciales mais libre
d'utilisation, qu'elles soient publiables sur le web par qui veut le faire,
sur les sites des uns et des autres, avec comme seule contrainte que les
contenus ne soit pas altérés, ni "revendiqués" de manière inappropriés. Pour
faire court, si "Jean Dupont" est l'auteur d'un des documents, et que
"Marcel durant" souhaite le publier sur son site ou dans sa revue, il ne
supprime pas le nom de "Jean Dupont".

 

6.2 Je propose de tout faire en TXT ou HTML ou Word pour les brouillons mais
en HTML pour les documents finaux, en séparant l'aspect "contenu" et
"éléments de structure" des aspects "la taille des titres" et autres
"couleurs". L'idée est que n'importe qui puisse adapter le document à son ou
ses média sans trop risquer de perdre contenu et structure.

 

Cordialement

Patrick Gross

 

 

_______________________________________________

Debat mailing list

Debat at ovni-sciences.net

http://www.ovni-sciences.net/mailman/listinfo/debat



Plus d'informations sur la liste de diffusion Debat