...
5.1 L’apprentissage autonome à partir du LN
Nous mentionnions précédemment l’habituelle absence
de relations extensionnelles. Les réseaux sémantiques
se contentent d’utiliser des concepts tels que les programmeurs
les encodent. S’agit-il réellement d’un problème
? Cela constitue au moins une limitation. Comme dans le cas du projet
Cyc (voir http://www.cyc.com), la
charge de travail est colossale pour qui tente de programmer une à
une les informations qui fourniraient un sens commun à une
machine. Et cette difficulté s’étend plus loin:
puisque le contenu de l’environnement varie sans cesse, les
connaissances changent aussi. Il faut donc poursuivre sans relâche
les corrections et la programmation des nouveaux faits pour rester
à jour pour que les représentations restent adaptées
à l’environnement.
Le
LN nous semble une source particulièrement riche d’informations,
surtout lorsqu’il s’agit de créer rapidement d’importantes
bases de connaissances sous forme de réseaux sémantiques.
Les textes contiennent des informations complexes qui impliquent,
entre autres, des relations de conjonction, de disjonction et de négation.
Des efforts pour exploiter la structure du LN dans l’apprentissage
des machines sont déjà manifestes (voir Iwanska et Shapiro,
2000). Et les avantages sont nombreux. Le LN implique la redondance
et la contradiction logique, ce qui permet d’intégrer
les sens non littéraux et d’identifier des fausses croyances.
Le LN motive également des apprentissages réels même
en l’absence des stimuli initiaux (ex.: l’apprentissage
humain grâce à la lecture) et il fournit de nombreux
avantages informationnels, allant du stockage de la connaissance à
l’échange d’informations entre agents. Le LN peut
représenter la plupart des connaissances et son utilisation
est généralisée chez l’être humain,
ce qui facilite les interactions avec les machines. Enfin, l’Internet
contient une quantité croissante d’informations sous
forme textuelle qui sont encore sous-exploitées.
L’analyse
automatique de nombreux types de textes à partir d’algorithmes
inspirés de la structure du LN constituera un moyen efficace
d’apprentissage pour les réseaux sémantiques (Voir
par exemple Church (1988) qui utilise la récurrence statistique
des mots pour leur associer la bonne étiquette grammaticale
lors de l’analyse textuelle.). Des recherches en linguistique
informatique ont également montré qu’il était
possible d’acquérir des informations linguistiques (ex.:
morphologie, classes sémantiques, noms composés, etc.)
à partir de vastes corpus de textes (Joshi, 1999). Sans être
la réponse à tous les problèmes, une plus grande
utilisation du LN pourrait engendrer de réelles améliorations.
Mais
même si nous utilisons de grandes quantités de textes
pour l’apprentissage des connaissances, il n’existe aucune
théorie générale sur la manière d’organiser
automatiquement ces concepts dans un réseau. Il n’est
donc pas suffisant de disposer de liens entre des concepts, encore
faut-il rendre ces liens polyvalents pour les exploiter de façon
productive. ...
1.
Introduction
2.
Les réseaux sémantiques en IA
3.
Incarnation et langage naturel
4.
Tirer profit des recherches sur la cognition humaine
5. Quelques suggestions issues des recherches sur la cognition humaine
6.
Conclusion
Bibliographie