Anthropic тестирует «моральные принципы» для своих моделей Claude

Сначала эта история начинается с ложного образа «черного ящика», который на самом деле оказывается не искусственным интеллектом, а Каабой – черным кубом в центре Заповедной мечети в Мекке. До завоевания Мекки Мухаммедом Кааба выполняла роль своеобразного места хранения многочисленных священных символов различных верований региона. Для людей того времени она была универсальным духовным центром, к которому обращались за защитой и благословением в самых разнообразных жизненных ситуациях.

Автор проводит параллель с тем, что Anthropic делает сегодня со своей моделью Claude. На прошлой неделе компания вместе с OpenAI участвовала в круглом столе в Нью-Йорке под названием «Завет веры и II», где собрались представители различных религиозных и духовных организаций, включая иудейские, индуистские, сикхские, православные и другие общины.

Эта встреча стала продолжением предыдущих инициатив Anthropic, которая уже консультировалась с христианскими лидерами, пытаясь обсудить возможное «моральное развитие» своих моделей. Компания заявляла, что стремится привлечь представителей различных вероучений и философских традиций, чтобы лучше понять этические границы поведения искусственного интеллекта.

По данным Associated Press, само мероприятие было организовано Международной неправительственной организацией, которая занимается вопросами межконфессионального диалога и безопасности сообществ. При этом OpenAI и Anthropic якобы выступили инициаторами контактов с религиозными представителями. В то же время остается неясным, являются ли эти встречи частью единой долгосрочной программы или отдельными инициативами разных команд.

В самих обсуждениях не было выработано общих «религиозных правил» для искусственного интеллекта. Вместо этого речь идет о попытке найти более общие этические принципы, которые могли бы помочь модели принимать решения в сложных или неоднозначных ситуациях, где четких инструкций просто не существует. Это и является основой так называемой «конституции Claude» – набора принципов, которые должны формировать поведение модели.

Некоторые эксперты, однако, относятся к таким подходам скептически. Они считают, что идея «научить морали» через консультации с религиозными лидерами может выглядеть привлекательно, но не гарантирует реальной предсказуемости или безопасности системы. По их мнению, это скорее попытка найти символическую основу для сложной технической проблемы, чем ее практическое решение.

В итоге остается открытым вопрос: Может ли искусственный интеллект действительно приблизиться к универсальным моральным принципам через подобные диалоги, или это лишь способ компаний показать, что они максимально серьезно относятся к этической стороне развития технологий.

Anthropic тестирует «моральные принципы» для своих моделей Claude

США планируют изъять Сирию из перечня государств-спонсоров терроризма

Сенатор Грэм согласовал с Белым Домом приемлемую версию закона о санкциях в отношении российской нефти

Глава МИД Нидерландов о перехватчиках для Украины: нужно давить на других

Глава МИД Ирана обсудил последние удары и Ормузский пролив с Оманом, Турцией и Пакистаном

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Финал чемпионата мира по футболу: дата, время, перерыв в перерыве, прогноз и Трамп

Аргентинские игроки размахивают политическим фолклендским флагом после матча с Англи

Тухель защищает тактику после того, как Аргентина выгнала Англию с чемпионата мира

«Эпический квадрат»: Скалони хвалит аргентинские камбэки на чемпионатах мира подряд

Аргентина одержала победу над Англией со счетом 2:1 и вышла в финал ЧМ-2026