Skip to content

Latest commit

 

History

History
55 lines (46 loc) · 1.78 KB

README.md

File metadata and controls

55 lines (46 loc) · 1.78 KB

GPSRGenDataset

Cette piste a été mise en pose le temps de réfléchir a quelle infos prioriser dans le dataset et comment les générer.

TOC

Compatibilitée avec Huric

Génération de 10000 exemples avec GPSRGen 2023

  • raw_dataset.csv
  • Commandes indexées par ID afin de pouvoir y faire référence même si on décide de ne traiter qu'une partie du dataset

Génération du dataset

Prérequis

Génération

# Variables d'env par défaut
# GEN_COUNT = 1000 (nombre de générations)
# GPSR_CMDGEN_IMAGE = ghcr.io/joxcat/gpsrcmdgen-gpsr:v2023.2 (image docker de GPSRCmdGen)
# OUT_FILE = raw-dataset.csv
./gen-dataset.rs

Expérimentation du process d'une ligne

Prérequis

  • python 3.11
  • poetry (pip install poetry)
poetry env use 3.11
poetry install

Process

echo 'go to the kitchen' | poetry run process-prompt.py