Anthropic тестирует «моральные принципы» для своих моделей Claude

Сначала эта история начинается с ложного образа «черного ящика», который на самом деле оказывается не искусственным интеллектом, а Каабой – черным кубом в центре Заповедной мечети в Мекке. До завоевания Мекки Мухаммедом Кааба выполняла роль своеобразного места хранения многочисленных священных символов различных верований региона. Для людей того времени она была универсальным духовным центром, к которому обращались за защитой и благословением в самых разнообразных жизненных ситуациях.

Автор проводит параллель с тем, что Anthropic делает сегодня со своей моделью Claude. На прошлой неделе компания вместе с OpenAI участвовала в круглом столе в Нью-Йорке под названием «Завет веры и II», где собрались представители различных религиозных и духовных организаций, включая иудейские, индуистские, сикхские, православные и другие общины.

Эта встреча стала продолжением предыдущих инициатив Anthropic, которая уже консультировалась с христианскими лидерами, пытаясь обсудить возможное «моральное развитие» своих моделей. Компания заявляла, что стремится привлечь представителей различных вероучений и философских традиций, чтобы лучше понять этические границы поведения искусственного интеллекта.

По данным Associated Press, само мероприятие было организовано Международной неправительственной организацией, которая занимается вопросами межконфессионального диалога и безопасности сообществ. При этом OpenAI и Anthropic якобы выступили инициаторами контактов с религиозными представителями. В то же время остается неясным, являются ли эти встречи частью единой долгосрочной программы или отдельными инициативами разных команд.

В самих обсуждениях не было выработано общих «религиозных правил» для искусственного интеллекта. Вместо этого речь идет о попытке найти более общие этические принципы, которые могли бы помочь модели принимать решения в сложных или неоднозначных ситуациях, где четких инструкций просто не существует. Это и является основой так называемой «конституции Claude» – набора принципов, которые должны формировать поведение модели.

Некоторые эксперты, однако, относятся к таким подходам скептически. Они считают, что идея «научить морали» через консультации с религиозными лидерами может выглядеть привлекательно, но не гарантирует реальной предсказуемости или безопасности системы. По их мнению, это скорее попытка найти символическую основу для сложной технической проблемы, чем ее практическое решение.

В итоге остается открытым вопрос: Может ли искусственный интеллект действительно приблизиться к универсальным моральным принципам через подобные диалоги, или это лишь способ компаний показать, что они максимально серьезно относятся к этической стороне развития технологий.

- Реклама -