r2ai-model

Collection of data sources to generate a dataset for training and finetuning LLM models to use radare2.

Organization

Dataset is stored in Q/A form (Question/Answer) separating them by tabs (TSV) where the question is phrased in English and the answer is an r2 oneliner to be executed by r2ai in auto mode.

/ -> root directory, scripts to generate raw QA
data/radare2_ok.tsv -> validated statements
data/radare2_todo.tsv -> unanswered questions
data/Attic/ -> already processed files
data/sources -> unfiltered data sources to be used to generate questions

Name		Name	Last commit message	Last commit date
Latest commit History 47 Commits
data		data
train		train
Makefile		Makefile
README.md		README.md
dataset-gen-prompt.txt		dataset-gen-prompt.txt
enrich-dataset.py		enrich-dataset.py
generate-dataset.py		generate-dataset.py
parse_usage.py		parse_usage.py
prepare-dataset.py		prepare-dataset.py
review-pending.sh		review-pending.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

r2ai-model

Organization

About

Releases

Sponsor this project

Packages

Contributors 2

Languages

radareorg/r2ai-model

Folders and files

Latest commit

History

Repository files navigation

r2ai-model

Organization

About

Resources

Stars

Watchers

Forks

Releases

Sponsor this project

Packages 0

Contributors 2

Languages

Packages