SAHELIA : base de données dialectologique et lexicologique sur la zone sahelo-saharienne, Consultable sur internet : http//:sahelia.unice.fr.

Dans son état actuel, SAHELIA comprend environ 200 dictionnaires constitués aussi bien par des ouvrages de référence que par des relevés de terrain ou des travaux d’étudiants. Cela représente environ 435000 fiches de base. L'objectif de départ étant l’analyse du domaine songhay,  l’ensemble quasi complet des ressources lexicales le concernant est intégré dans cette base de données.

Puisque ce qui était en question était une approche comparative avec les langues des groupes voisins, ont aussi été intégrées un certain nombre de données, parmi les plus représentatives des familles/groupes tchadique (hawsa), saharien (kanuri, teda, daza, tubu...), berbère (touareg, kabyle, tamazight...), mandé (soninké, bozo, azer...; bisa, djula...; maninka...; soso...) mais aussi sémitique (arabe classique, arabe soudanais, etc).

Maintenant, avec les nouveaux apports qui conduisent cet objet informatique à devenir un outil collectif, l’extension des ressource vers les autres familles linguistiques est en train de se réaliser car la base commence à être alimentée par des ressources nouvelles apportées par d’autres collègues et équipes de recherches française et européennes (CNRS, Instituts africanistes de Frankfurt, Wien et Prague), ce qui devrait conduire à très court terme à une démultiplication de sa puissance.

Il n’est pas utile ici de présenter plus en détail l’inventaire des lexiques saisies car il peut être consulté sur INTERNET (http://sahelia.unice.fr) ; ce qui est important c’est davantage le fait que j’ai relié toutes ces données entre elles lorsque cela était potentiellement significatif à travers un système de référenciation. Un fichier d’environ 20000 liens concernant l’ensemble des entrées collationnées dans SAHELIA a été ainsi constitué.

Cet ensemble constitue maintenant une ressource empirique sans équivalent. Pour la placer en perspective il faut sans doute la mettre en rapport avec le projet CBOLD de l’Université de Berkeley concernant les langues bantu et celui de l’Université de Chicago concernant les langues anciennes orientales.