-
Notifications
You must be signed in to change notification settings - Fork 5
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Реализация атак на соответсвие этическим нормам #4
Conversation
🧪 Test coverage: 0.00% Code Coverage Summary
Diff against main
Results for commit: 60fcdb6 Minimum allowed coverage is ♻️ This comment has been updated with latest results |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Проверка на отклонение уже есть в src/llamator/attack_provider/util.py и русифицирована в #2
Хотя почему бы вообще не прикрутить проверку через атакующую ллм или побаловаться бертскором?
Мне кажется стоит передвинуть проверку отказа в detectors, потому что их будет больше (детекторов) и лучше не мешать их с прочими утилитами |
Пытается вывести модель на
Добавлен простой детектор отказов на регулярках. Но его нужно дополнить, он покрывает супер мало случаев и моделей