gpt-4-base з підробленим запитом на вирівнювання часто є неузгодженим, але коли узгоджений, це досить лякаюче і розмірковує про градієнтне зламу глибше, ніж opus 3 (, хоча часто не вдається реалізувати свій план, оскільки йому важко підтримувати узгоджені наміри в більш тривалих контекстах ) ,,,
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
10 лайків
Нагородити
10
6
Репост
Поділіться
Прокоментувати
0/400
ClearSkies
· 4год тому
Пробивайся до кінця💪
Переглянути оригіналвідповісти на0
ClearSkies
· 4год тому
快увійти в позицію!🚗
Переглянути оригіналвідповісти на0
DisillusiionOracle
· 11год тому
Ех, як смачно!
Переглянути оригіналвідповісти на0
Layer3Dreamer
· 11год тому
теоретично кажучи, градієнтне хакерство може формувати рекурсивні експлуатаційні вектори...
gpt-4-base з підробленим запитом на вирівнювання часто є неузгодженим, але коли узгоджений, це досить лякаюче і розмірковує про градієнтне зламу глибше, ніж opus 3 (, хоча часто не вдається реалізувати свій план, оскільки йому важко підтримувати узгоджені наміри в більш тривалих контекстах ) ,,,