В последние годы большие языковые модели (LLM — Large Language Models) быстро развивались и внедрялись в разные сферы деятельности человечества. Так же они всё чаще используются в образовательных контекстах, для создания персонализированной учебной среды, путём моделирования и адаптации к когнитивным и практическим навыкам каждого индивидуума. Всё чаще применяются адаптивные технологии, которые могут использовать различные представления для индивидуальной педагогической поддержки в процессе обучения. Технологии уже достигли того уровня развития, когда искусственный интеллект может использоваться для предоставления контекстно-зависимой обратной связи посредством взаимодействия с учащимся на естественном языке. Разработчики изобретают всё новые методики для решения сложных задач, что позволит создавать электронных персонализированных преподавателей на базе искусственного интеллекта, которые смогут улучшить процесс обучения, учитывая уникальный опыт, способности, мотивацию и социально-эмоциональные потребности каждого ученика.
Такое быстрое внедрение и непрерывное развитие продолжают оказывать влияние на многие отрасли и области исследований, особенно в связи с тем, что каждое новое поколение больших языковых моделей предлагает новые возможности — например, увеличение мощности серверов (частота и количество ядер процессоров, увеличение оперативной памяти) позволило безболезненно развивать мультимодальность и создавать более длинные размеры входного контекста. Но педагоги утверждают, что этого недостаточно, а персонализированные системы могут (и должны) быть расширены для предоставления поддержки учащемуся в более широком объёме, выходя за рамки парадигмы понимания только академической успеваемости. Необходимо также учитывать социальные, аффективные, мотивационные, культурные и языковые характеристики, которые, как известно, влияют на общий процесс обучения.
Персонализированные среды обучения (PLE — Personalized Learning Environments) используют модели, которые являются структурированными представления об учениках, однако они пока не могут поддерживать целостность процесса, поскольку обычно ограничиваются моделированием приобретения знаний (например, уровнем освоения учебного материала) и, в лучшем случае, одной дополнительной характеристикой (например, владение базовыми знаниями) или поведением/индивидуальными способностями (вовлеченностью, упорством, внимательностью и т.п.). Сложность такого целостного моделирования проистекает из того факта, что недостаточно просто учесть каждую характеристику и поведение по отдельности — а эти факторы должны рассматриваться комплексно. Хотя сложное взаимодействие этих составляющих представляет собой значительную проблему для существующих PLE. Но всем известно, что человек способен обеспечить такую целостную поддержку на практике, учитывая, что учителя-люди успешно объединяют эти элементы для ежедневного взаимодействия с учениками.
Сейчас специалисты выделяют три ключевые области, в которых сообществу необходимо добиться прогресса для достижения более широкого видения моделирования целостного обучения:
1.) Интерпретация представления о каждом учащемся: необходимо представлять человека явно и точно, включая как когнитивные, так и другие аспекты. Хотя методы глубокого обучения традиционно рассматривались как подходы «чёрного ящика» с непрозрачными внутренними механизмами (алгоритмами), но последние достижения в исследованиях интерпретируемости и объяснимости работают над решением этой проблемы. Именно они хорошо подходят для приложений в контексте создания педагогических моделей.
2.) Адаптивность технологий: учитывая характеристики учащегося, их следует использовать для адаптации доставки педагогического контента и поддержки. Используя данные о поведении и предпочтениях ученика, а также динамически корректируя учебные стратегии для удовлетворения индивидуальных потребностей, адаптивные системы могут предоставлять персонализированные пути обучения, которые развиваются вместе с развитием навыков человека.
3.) Характеристика педагогических агентов (то есть учителей или наставников): данный процесс относится к ручному определению и оценке поведения (или политики) «агента». Например, в интеллектуальной системе обучения классные руководители могут создавать распространённые заблуждения, основываясь на своём опыте преподавания. Создатели обучающих инструментов могут иметь разный опыт или специфику работы (например, исследователи, педагоги и разработчики), поэтому ключевой задачей при разработке авторских программ является обеспечение баланса между доступностью и минимизацией когнитивной нагрузки. Наконец, разработка тесно связана с вопросом оценки, что является важным шагом в плавном внедрении этих систем для реальных учащихся.
Без надёжной интерпретации невозможно понять, какую информацию модели используют для принятия решений или генерации ответов. В отличие от обученных специалистов в области образования, автоматизированным моделям нельзя доверять в плане надлежащего учёта предыдущих знаний или эмоционального состояния студентов для предоставления соответствующих рекомендаций. Нельзя быть уверенным, что они не будут использовать конфиденциальную демографическую информацию неправильным образом. С другой стороны, когда нельзя достоверно объяснить поведение LLM, то невозможно гарантировать, что желаемое поведение в одном контексте будет обобщено на другие (например, будет ли внимательность к эмоциональным потребностям студентов с высоким социально-экономическим статусом перенесена на менее обеспеченных студентов).
Гибридный подход не должен быть слишком сложным; например, можно начать с обучения традиционной модели обучающегося и передачи ее выводов искусственному интеллекту в качестве дополнительного компонента входных подсказок. Однако крайне важно гарантировать, что действительно будут учитываться выходные данные модели обучающегося, а также то, что информация будет использована таким образом, чтобы это соответствовало лучшим образовательным практикам. В противном случае этот подход не принесёт пользы заинтересованным сторонам в сфере образования — ни учителям, ни самим студентам.
Уже доказано, что специализированные большие языковые системы хорошо подходят для продвижения открытых моделей обучения, благодаря их возможностям диалога на естественном языке. Их наработки, которые совершенствуются каждый день и час, позволяют учащимся просматривать и взаимодействовать с представлением собственных знаний и опыта признанных специалистов, способствуя размышлению и саморегулируемому обучению. Эта прозрачность и интерактивность могут улучшить традиционные практики/программы обучения открытого доступа, позволяя учащимся более свободно изменять свои пути познания и освоения материала. Внедрение и интеграция LLM с открытыми программами обучения имеет потенциал для революции в образовательных технологиях, делая процессы усвоения знаний более адаптивными и персонализированными.
Кроме того, разговорные агенты могут поддерживать социально-эмоциональное обучение маленьких детей, обучая их внутреннему диалогу, а эффективная обратная связь с эмпатичным агентом, включая полноформатный диалог, повышает уверенность и мотивацию, положительно влияет на отношение ученика к процессу — то есть вовлекает его в обучение.
Однако LLM (пока) не являются «готовым» решением для создания истинных педагогических агентов, поскольку остаётся несколько ключевых проблем. Создание учителей-наставников на основе ИИ и нейросетей требует эффективной навигации по неограниченному пространству возможных подсказок, что может быть сложно сделать без опыта проектирования таких подсказок в тесном взаимодействии с признанными специалистами в каждой области знаний. А привлечь таких специалистов к разработке — является немалой проблемой. Более того, было доказано, что выходные данные LLM очень чувствительны к незначительным изменениям подсказок, что часто приводит к непоследовательным и запутанным (не истинным) результатам.
Не стоит откидывать и этический вопрос авторства. Ведь разработчики оперируют не своими знаниями, а используют такие методы, как генерация дополненного поиска и возможности поиска «иголки в стоге сена», что позволяет быстро изменять поведение «электронных педагогов», потенциально даже позволяя им напрямую оперировать отсылками к более длинным документам, таким, как научные обзоры или книги с практическими доказательствами. Но, и у обзоров, и у книг есть авторы. Социум пока не разработал механизмов отслеживания и регулирования авторских прав на использование этих материалов в цифровых образовательных процессах.