Проект «Исследование потенциала социальных сетей для выявления, привлечения и закрепления талантливой молодёжи в региональных вузах на основе анализа больших данных»

Номер проекта: 17-16-70004 РФФИ


image.png

1.jpg
Гойко Вячеслав, Степаненко Андрей, Фещенко Артем на  
семинаре по обсуждению алгоритмов очистки
пользовательских данных, выгруженных из "Вконтакте".


2.jpg
Мацута Валерия - обсуждение модели прогнозирования одаренности
абитуриентов по цифровым следам "Вконтакте".

2
Кабанова Татьяна, Фещенко Артем, Степаненко Андрей -
обсуждение методов контент-анализа текстов со стены
пользовтелей "Вконтакте".


4
Можаева Галина Васильевна, руководитель проекта -
обсуждение результатов исследования на конференции.

5
Резанова Зоя Ивановна на семинаре по обсуждению подходов по
выявлению лингвистических маркеров профессиональных интересов
абитуриента  "Вконтакте".
 

6
Суханова Елена Анатольевна на семинаре по проектированию
модели целевого абитуриента ТГУ.


7
Фещенко Артем - представление результатов исследования
на конференции.


1.jpg
Мацута Валерия - обсуждение рабочих материалов исследования
для публикации в научном журнале.


В настоящий момент в социальных сетях генерируются значительные потоки информации, которые характеризуются высоким уровнем динамичности и масштабности. На основе использования современных технологий анализа больших данных получаемая из социальных сетей информация, которая на первый взгляд представляется разрозненной, может быть распределена по огромному количеству критериев – как общих для отдельных групп пользователей, так и персонально-ориентированных. Эти критерии формулируются в соответствии с социальными и экономическими задачами, решаемыми как на национальном, так и на региональном уровне. Так, регионы, стремясь повысить качество системы высшего образования и расширить рынок предлагаемых образовательных услуг, нацелены на обеспечение высокого уровня подготовки будущих студентов и достижение значительных показателей поступления абитуриентов в региональные вузы. Для достижения поставленных перед регионом целей в извлекаемых из социальных сетей данных необходимо находить закономерности, на основе которых можно выявить основные психологические и поведенческие характеристики целевой аудитории, ее интересы и профессиональные увлечения, а также определить особенности формирования единого портрета интересующего регион пользователя, т.е. будущего студента вуза.

Цель Проекта

Исследование возможностей анализа больших пользовательских данных из социальных сетей для выявления, привлечения и закрепления талантливой молодёжи в региональных вузах.

Задачи Проекта

  • Сбор гетерогенных данных из различных источников социальной сети «Вконтакте», их структурирование и определение ключевых метаданных.
  • Анализ полученных данных и разработка комплексной модели потенциального абитуриента для региональных вузов (на примере ТГУ) на основе специфических социальных, демографических, коммуникативных и поведенческих признаков пользователя «Вконтакте».
  • Создание инструментов для прикладного использования комплексной системы анализа данных социальных сетей в образовательном маркетинге для привлечения к поступлению и закреплению в региональных вузах талантливой молодёжи.

Сроки реализации проекта

2017-2018 гг.

Руководитель проекта

Можаева Г.В. кандидат исторических наук, доцент, зав. каф. гуманитарных проблем информатики, директор ИДО ТГУ

Исполнители проекта

  • Суханова Е.А., кандидат педагогических наук, доцент, заместитель директора НОЦ «Институт инноваций в образовании» ТГУ.
  • Фещенко А.В., старший преподаватель каф. гуманитарных проблем информатики, заведующий учебно-научной лабораторией компьютерных средств обучения.
  • Захарова У.С., кандидат филологических наук, специалист по научно-методической работе ИДО ТГУ.
  • Резанова З.И., доктор филологических наук, зав. каф. общего славяно-русского языкознания и классической филологии.
  • Мацута В.В., кандидат психологических наук, доцент кафедры организационной психологии факультета психологии ТГУ.
  • Орлов С.А., канд. физ.-мат. наук, Директор  межрегионального супервычислительного центр ТГУ (2017 год).

Новизна и оригинальность

Новизна предложенного подхода по оценке образовательного потенциала абитуриентов заключается в анализе их цифровых следов из социальных сетей, в отличие от распространенной практики измерения успешности обучения по формальным достижениям (ЕГЭ, олимпиады и пр.). Данный подход позволяет прогнозировать наличие высокого образовательного потенциала абитуриента до подачи им заявления в вуз, без трудоёмких традиционных диагностик когнитивных способностей, без ограничений по месту проживания абитуриентов и его удаленности от вуза, с высокой скоростью и точностью прогнозирования. Данные о потенциальных абитуриентах из социальной сети используемые для реализации подхода являются открытыми, накопленными в течении значительного периода времени (в среднем 3-8 лет). Междисциплинарное исследование по выявлению взаимосвязи цифровых следов с когнитивными особенностями личности проведено с помощью методов психодиагностики, профайлинга, компьютерной лингвистики, компьютерных наук (алгоритмы машинного обучения и datamining ), социально сетевого анализа, математического анализа. Комбинация методов анализа данных для достижения цели проекта является оригинальной.

Результаты реализации проекта

  1. Изучены возможности и разработаны инструменты сбора больших открытых данных о пользователях социальных сетей на примере русскоязычной сети «Вконтакте» для выявления абитуриентов с высоким образовательным потенциалом. Сформирован и открыт для исследователей обезличенный набор данных по абитуриентам Сибирского федерального круга за 2017 г. (128 тыс. пользователей), за 2018 г. (302 тыс. пользователей). Доступ к данным предоставляется по запросу на сайте http://opendata.university.
  2. Изучен информационный потенциал пользовательских данных из «Вконтакте» для выявления образовательных интересов школьников по их подпискам на тематические сообщества. Разработана прогностическая модель позволяющая с высокой точностью классифицировать абитуриентов по их подпискам «Вконтакте» по интересным им направлениям подготовки до подачи ими заявлений о поступлении в приёмные комиссии вузов. Проверка модели на 5 тыс. абитуриентов СФО показала точность прогнозирования интересов к профессиональному образованию в области гуманитарных наук 81%, точных наук – 93%, естественных наук – 83%.
  3. Подтверждена гипотеза о возможности формализации сведений об интересах пользователей социальной сети «Вконтакте» к той или иной предметной области через автоматическую классификацию текстов, опубликованных в личных профилях пользователей «Вконтакте».
  4. Выявлена взаимосвязь признаков одаренности у старшеклассников с их подписками на тематические сообщества «Вконтакте». Разработана оригинальная математическая модель прогнозирования наличия признаков одаренности. Проверка модели показала точность прогнозирования у абитуриентов высокого уровня интеллекта (юноши 69%, девушки 57%), креативности (юноши 83%, девушки 78%), мотивации (юноши 90%, девушки 82%). 
  5. Проверено предположение о наличии особенностей в структуре социальных связей у одаренных старшеклассников с помощью метода анализа социальных сетей (social network analysis) и изучены возможности визуализации сетевых взаимодействий потенциальных абитуриентов в социальной сети «ВКонтакте».
  6. Разработана модель целевого абитуриента для регионального вуза на примере ТГУ на основе пользовательских данных старшеклассников из «Вконтакте». В 2017 году модель и алгоритм апробированы для набора в ТГУ перспективных абитуриентов для гуманитарных направлений подготовки. В 2018 году применение модели позволило обеспечить набор 243 абитуриентов (11% от общего набора студентов на 1 курс бакалавриата в ТГУ).
  7. Изучены факторы, определяющих выбор абитуриентом вуза и образовательной программы на основе материалов из социальных сетей, что позволило уточнить представление о особенностях поиска и выбора абитуриентами образовательных программ и организаций, выделить 28 тем-триггеров для целевой аудитории и разработать методику эффективной маркетинговой коммуникации с абитуриентами «Вконтакте».
  8. Описаны особенности коммуникации университета с перспективными абитуриентами в социальной сети, которые заключаются в адаптации рекламных кампаний под культурные особенности молодого поколения и жанровые особенности контента в социальных сетях. Сравнение контрольной группы абитуриентов (найденных и привлеченных через «Вконтакте») с общим контингентом абитуриентов показал среднее увеличение доли поступивших абитуриентов от подавших заявления по всем программам на 68%.
Результаты, полученные при реализации проекта, в целом соответствуют мировому уровню. Они описаны в 13 работах, в том числе в 11 статьях, опубликованных в индексируемых изданиях (включая Web of Science и/или Scopus), представлены на 6 конференциях. Результаты исследования в 2018 г. успешно защищены магистрантами Института человека цифровой эпохи ТГУ Корепановым К.В. и Ошевой М.С.

Конференции

  1. Международная научно-практическая конференция «Информационные технологии в гуманитарных науках» (Красноярск, сентябрь 2017),  доклад «Анализ больших данных в решении образовательных задач» на секции «DH: традиции и инфраструктура».
  2. Международная конференция «International Conference on Education and New Learning Technologies» (Испания, июль 2017), доклад «RECRUITING UNIVERSITY ENTRANTS VIA SOCIAL NETWORKS» на секции «COMPUTER SUPPORTED COLLABORATIVE WORK».
  3. Международная конференция в области новых образовательных технологий в среднем, высшем и профессиональном образовании «EdCrunch Томск» , секционный доклад (Россия, Томск, 30 мая - 1 июня 2018), доклад «Выявление талантливой молодежи и привлечения в региональные вузы на основе анализа больших данных в социальных сетях» на исследовательской сессии«Большие данные в образовании».
  4. 12th International Technology, Education and Development Conference (INTED2018), March 5th-7th , 2018 – Valencia, Spain, секционный доклад «MODELLING OF AN EDUCATIONAL PROFILE OF A STUDENT BY ANALYZING PUBLIC USER DATA FROM SOCIAL NETWORKS», виртуальное участие.
  5. Международная конференция в области новых образовательных технологий в среднем, высшем и профессиональном образовании «#EDCRUNCH2018: Данные, которые трансформируют» (Россия, Москва, октябрь 2018), доклад «Предсказание когнитивных способностей учащихся по цифровым следам в социальной сети» на исследовательской кейс-сессии «Цифровой университет» .
  6. Международная научная конференция о настоящем и будущем онлайн-образования «eLearning Stakeholders and Researchers Summit 2018» (Россия, Москва, декабрь 2018), доклад «Моделирование признаков одаренности учащихся по цифровым следам в социальной сети «ВКонтакте» на исследовательской кейс-сессии «Психометрика и аналитика онлайн-обучения».


Публикации по результатам проекта

  1. Гойко В.Л., Киселев П.Б., Суханова Е.А., Фещенко А.В., Мацута В.В. Методы и инструменты привлечения перспективных абитуриентов в вуз через социальные сети// Открытое и дистанционное образование, 2017, 4, c. 45-52.
  2. Можаева Г.В., Фещенко А.В. Анализ больших данных в решении образовательных задач// Информационные технологии в гуманитарных науках: тез. докл. науч.-практ. конф., 2017, c. 49-50
  3. Мацута В.В., Киселев П.Б., Фещенко А.В., Гойко В.Л. Исследование потенциала социальных сетей для выявления одаренных старшеклассников//Психология и Психотехника, 2017, 4, c.104-121
  4. Фещенко А.В., Степаненко А., Гойко В.Л. Recruiting university entrants via social networks// EDULEARN17 Proceedings 9th International Conference on Education and New Learning Technologies, 2017, c.6077-6082
  5. Можаева Г.В., Фещенко А.В., Слободская А.В. Информационный потенциал социальных сетей для выявления образовательных потребностей школьников//  Открытое и дистанционное образование, 2017, 67, c.25-30
  6. Фещенко А.В., Васюков К.Л., Ошева М.С. Определение образовательных интересов пользователей социальной сети “ВКонтакте” через анализ тематических сообществ// Информационные технологии в гуманитарных науках: тез. докл. науч.-практ. конф., 2017, c.60-61
  7. Фещенко А. В. Определение образовательных интересов школьников на основе анализа пользовательских данных «Вконтакте»// Гуманитарная информатика, 2017, 13, c.84-89
  8. Степаненко А.А., Шиляев К. С., Резанова З. И. Атрибуция профессиональных интересов пользователей социальной сети «ВКонтакте» на основе текстов тематических групп и персональных страниц// Вестник Томского государственного университета. Филология. , 2018, 52, c.130–144
  9. Васюков К.Л., Ошева М.С., Фещенко А.В. Университет в поисках своего абитуриента в социальных сетях: маркетинговые и технологические задачи// Гуманитарная информатика, 2018, 14
  10. Можаева Г.В., Суханова Е.А., Фещенко А.В.Привлечение и удержание университетами абитуриентов с высоким образовательным потенциалом с помощью анализа открытых пользовательских данных социальной сети «ВКонтакте»// Открытое и дистанционное образование, 2018, 72, с.52-58
  11. Кабанова Т.В., Корепанов К.В., Мацута В.В., Можаева Г.В.,  Фещенко А.В. Моделирование признаков одаренности учащихся по цифровым следам в социальной сети «ВКонтакте»// eLearning Stakeholders and Researchers Summit 2018, 2018, c.111-118
  12. Feshchenko A., Goiko V. , Matsuta V. , Stepanenko A. , Kiselev P. Modelling of an educational profile of a student by analyzing public user data from social networks//INTED2018 Proceedings, 12th International Technology, Education and Development Conference, 2018, March 5th-7th , 2018 – Valencia, Spain, c.640-646
  13. Степаненко А.А., Резанова З.И., Гойко В.Л.  Автоматическая классификация контента персональных страниц пользователей социальной сети «Вконтакте» как маркеров профессиональных интересов абитуриента // Гуманитарная информатика 2018, 15

Электронные СМИ о проекте