Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
DPO Trainer		DPO Trainer
.gitignore		.gitignore
README.md		README.md

Repository files navigation

18980 Graduate Research Project

Constraint Satisfaction in LLMs using Dynamic Penalty Integration in DPO

About

18980 : Graduate Research project

Report repository

Releases

No releases published

Packages

Contributors

Languages