lucidia-main/lucidia_llm/data/schemas.md at b49cb92ba1628b489071ce2d46cfc9b1742ad96d - lucidia-main - RoadCode — BlackRoad OS

lucidia/lucidia-main

mirror of https://github.com/blackboxprogramming/lucidia.git synced 2026-03-17 08:57:17 -05:00

Files

blackboxprogramming fa4f69097f Add data/schemas.md with dataset schema descriptions

2025-08-08 01:18:53 -07:00

13 lines

281 B

Markdown

Raw Blame History

 # Dataset Schemas
 ## Pretraining Dataset
 - Input text: Raw text for language modeling.
 ## SFT Dataset
 - Instruction: User instruction text.
 - Response: Assistant response text.
 ## RLHF Pairs
 - Chosen: Preferred assistant response.
 - Rejected: Less preferred assistant response.