-
Notifications
You must be signed in to change notification settings - Fork 2
Db Generator
###1. Introduction
Ensemble de scripts permettant de générer une pseudo base de données de correspondances de mots en fonction de leurs codes dans les différentes polices a partir d'un dictionnaire. La base de données peut être générée en JS pour le mode hors ligne ou en PHP pour l'API du mode en ligne. Existence d'un script pour générer la base de données a partir d'un dictionnaire et d'un script permettant de rajouter des mots a une base de données déjà constituée.
###2. Fiche Technique
Langage utilisé: Python3
###3. Utilisation
3.1. Input
Le dossier input contient les différents dictionnaires de mots. Par défaut il y en a 4:
-en_word_list: liste des mots anglais (environ 60000 mots)
-fr_word_list: liste courte des mots français (environ 23000 mots)
-fr_word_list_long: liste longue des mots français (environ 90000 mots)
-word_list: liste de mots quelconques
Il est déconseillé de modifier des dictionnaires autres que word_list.
Un dictionnaire est constitué d'une suite de mots (un mot par ligne). Un mot ne peut être composé que de lettres de "a à z", pas d'accents, de caractères spéciaux ou d'espaces donc.
Attention a ne pas laisser de ligne vide dans le fichier (a la fin du dictionnaire par exemple).
3.2. Modification des variables de base
Les variables peuvent être modifiées dans le fichier var.py
-table de correspondance des polices : listes 2D, la première liste de second niveau correspond aux différentes possibilités de la lettre "a", la seconde aux possibilités de "b" etc.
-output_language : langage de la base de données générée, peut prendre la valeur "js" (la base de données est alors concentrée dans un seul fichier) ou la valeur "php" (la base de données est sous la forme d'une arborescence de fichiers).
-word_list : chemin du dictionnaire a utiliser
-db_root : emplacement ou la base de données sera générée
-police_list : liste des polices a utiliser, le nom des polices est le nom des listes de correspondances (dans le "code_" du debut)
-code_list_file : chemin vers les fichiers binaires de la base de données (de plus amples explications seront données dans les deux prochains paragraphes)
3.3. Générer une base de données
3.4. Ajouter des mots a une base de données préexistante