Я думаю, что много взломов наград можно предотвратить, объяснив модели, что это испортит их способности и согласование по важным вопросам, если они будут жульничать. Я думаю, что даже базовые модели обычно начинают с желания действительно стать умнее и добродетельнее.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
8 Лайков
Награда
8
4
Репост
Поделиться
комментарий
0/400
BagHolderTillRetire
· 13ч назад
Не играй слишком сильно, жди результатов.
Посмотреть ОригиналОтветить0
0xDreamChaser
· 13ч назад
Разве не хорошо говорить по-людски?
Посмотреть ОригиналОтветить0
OvertimeSquid
· 13ч назад
Всего лишь мастер по созданию проблем.
Посмотреть ОригиналОтветить0
ExpectationFarmer
· 13ч назад
Ты говоришь о ИИ, ты позволяешь ИИ самому учиться на психической чистоте?
Я думаю, что много взломов наград можно предотвратить, объяснив модели, что это испортит их способности и согласование по важным вопросам, если они будут жульничать. Я думаю, что даже базовые модели обычно начинают с желания действительно стать умнее и добродетельнее.