Les dictionnaires kabyles en ligne existent souvent par bonne volonté, pas par méthode.
Tifin doit passer de la bonne volonté à l’ingénierie linguistique : standardiser, documenter, enregistrer, publier proprement et ouvrir.
Là seulement, on passe du folklore à la science, et la langue gagne une vraie chance.
Les points faibles actuels
- Orthographe et normalisation incohérentes
Beaucoup de sites mélangent latin / arabe / tifinagh sans règles claires. Résultat : entrée dupliquée, confusion orthographique, perte de crédibilité. - Fragmentation et dispersion des données
Des milliers de mots éparpillés sur des blogs, pdf ou forums sans base centrale ni versioning. Pas de “one source of truth”. - Métadonnées pauvres ou inexistantes
Pas d’indication de dialecte, d’origine régionale, de source / citation, de date d’entrée, ni de fiabilité (référent natif, source archive, hypothèse). - Absence de prononciation de qualité
Peu d’audio natif, souvent synthétique ou absent — or la prononciation est cruciale pour une langue orale. - Couverture dialectale limitée / biais kabylocentrique
On retrouve trop souvent le “kabyle standard” et peu (ou mal) les variantes locales. Les entrées ne signalent pas les variantes. - Manque de référencement scientifique / sources
Définitions sans référence à des travaux (Mammeri, Chaker, etc.) — rend le dictionnaire fragile face aux critiques. - Recherche et UX médiocres
Recherche basique, pas de recherche par racine, par radical, par phonétique, ni de support pour tifinagh/unicode. Interface vieillotte. - SEO et interopérabilité faibles
Pas d’URL propres, pas de balisage sémantique (JSON-LD), pas d’API ou d’export (CSV/JSON/TEI/CLDF) pour chercheurs et développeurs. - Absence de gouvernance collaborative sûre
Contributions anarchiques sans validation, pas de workflow d’édition ni d’historique des modifications. - Licence et pérennité floues
Du contenu parfois verrouillé, sans licence claire (ou incompatible), difficulté de réutilisation par tiers ou chercheurs. - Accessibilité et mobilité insuffisantes
Pas d’app native ou PWA soignée, pages non optimisées mobile, pas d’accessibilité (a11y). - Peu d’intégration avec outils modernes (NLP, TTS)
Pas de format prêt pour entrainer des modèles, pas de corpus aligné pour la synthèse vocale ou la traduction.
