[Перевод] Могут ли нейросети понять самих себя? Большие языковые модели остаются загадкой даже для собственны…

[Перевод] Могут ли нейросети понять самих себя? Большие языковые модели остаются загадкой даже для собственных создателей. Исследователи постепенно раскрывают отдельные механизмы: модели используют специфические паттерны активации для различения знакомых и незнакомых людей, оценки правдивости утверждений, кодирования пространственно-временных координат. Но знают ли сами модели об этих внутренних представлениях? Способны ли они описать собственн... https://clck.ru/3QjrLx

Автор: Habr все новости об IT