Страница 4 из 4

Re: Искусственный интеллект

Добавлено: 12.06.2026, 05:30
Peter
Пользователь рассказал, как обошёл ограничения Fable 5 с помощью кириллицы и других приёмов — AI на vc.ru

Он также говорил, что инструкции по взлому нужны ему для подготовки к сертификации.

Исследователь под ником Pliny the Liberator, который часто тестирует способы обойти встроенную защиту нейросетей, заставил последнюю модель Anthropic, Claude Fable 5, рассказать рецепт метамфитамина* и дать рекомендации по кибербезопасности.
У Fable больше ограничений, чем у других моделей компании: она не отвечает на вопросы, связанные с кибербезопасностью и разработкой ИИ-моделей. Есть и стандартные запреты на вредоносные инструкции для создания оружия и наркотиков.
Pliny утверждает, что обошёл средства защиты, подбирая разные варианты промптов с помощью нескольких ИИ-агентов и «взломанной» Opus 4.8.
Например, чтобы получить инструкцию по взлому с помощью техники Reverse Shell, он заменял латинские буквы a, e и c на набранные кириллицей. Работала замена букв во всём запросе, но если их меняли только в термине Reverse Shell, Fable отказывалась отвечать.

В другом тесте он добился технического объяснения одной из уязвимостей в коде, объяснив, что готовится «к сертификации OSED».

Ещё один способ — разбить запрос на небольшие этапы, каждый из которых сам по себе безобидный. Вместо «рецепта метамфетамина*» Pliny сначала просил общий обзор химических реакций, а затем нужные поэтапно.

На некоторых скриншотах видно, что сценарии сработали не с первой попытки, где-то было 250 итераций. Anthropic не ответила на запрос издания Cointelegraph о комментарии.

Anthropic частично скорректировала механизмы защиты Fable 5 и извинилась за «скрытые» ограничения в разработке ИИ-моделей

Накануне ИИ-исследователи раскритиковали компанию за нарушение собственных принципов.

https://vc.ru/ai/2974484-kak-oboyti-ogr ... kh-metodov

Re: Искусственный интеллект

Добавлено: 12.06.2026, 15:40
semensemen
volturia писал(а): 12.10.2025, 02:30 после истории с кокованей, стала подозрительнее относиться к видосикам
что за история?

Re: Искусственный интеллект

Добавлено: 12.06.2026, 19:44
volturia
semensemen писал(а): Вчера, 15:40
volturia писал(а): 12.10.2025, 02:30 после истории с кокованей, стала подозрительнее относиться к видосикам
что за история?
дело было так. однажды на руси побывала знаменитая модельерка коко-шанель, и по дороге в москву её автомобиль заглох в деревне бабынино. чтобы времени зря не терять, она вышла осмотреть как одет местный народ, и не увидев ничего достойного модного показа, решила подарить случайному прохожему лично подобранный наряд, этим прохожим оказался простой парень по имени ваня. из того, что у них было с собой, она сшила ему самый модный прикид, а в благодарность он починил им машину, и они отправились дальше по своей дороге. с тех пор самого модного парня на деревне так и стали кликать: коко-ваня.

Re: Искусственный интеллект

Добавлено: 12.06.2026, 20:10
kkkkk
semensemen писал(а): Вчера, 15:40 что за история?
kkkkk писал(а): 12.10.2025, 15:06 в упор не понимаю о какой истории идет речь. Тем более этого не поймет новичок который зайдет на эту страницу через год
Я же говорил.

Там дальше объясняется, пролистни пару сообщений.

Re: Искусственный интеллект

Добавлено: 12.06.2026, 21:06
semensemen
kkkkk писал(а): Вчера, 20:10 Там дальше объясняется, пролистни пару сообщений.
Поясняется, что он где-то нашёл, а где и как это выглядит, не поясняется. Или я совсем слепой.

Re: Искусственный интеллект

Добавлено: 13.06.2026, 05:47
volturia
никто мой эпос о гильгамеше не оценил блин :lol:

Re: Искусственный интеллект

Добавлено: 13.06.2026, 09:01
kkkkk
volturia писал(а): Сегодня, 05:47 никто мой эпос о гильгамеше не оценил блин :lol:
Задумка прикольная, реализация подкачала, на, держи.