Номер проекта:
17-16-70004 РФФИ
В настоящий момент в социальных сетях генерируются значительные потоки информации, которые характеризуются высоким уровнем динамичности и масштабности. На основе использования современных технологий анализа больших данных получаемая из социальных сетей информация, которая на первый взгляд представляется разрозненной, может быть распределена по огромному количеству критериев – как общих для отдельных групп пользователей, так и персонально-ориентированных. Эти критерии формулируются в соответствии с социальными и экономическими задачами, решаемыми как на национальном, так и на региональном уровне. Так, регионы, стремясь повысить качество системы высшего образования и расширить рынок предлагаемых образовательных услуг, нацелены на обеспечение высокого уровня подготовки будущих студентов и достижение значительных показателей поступления абитуриентов в региональные вузы. Для достижения поставленных перед регионом целей в извлекаемых из социальных сетей данных необходимо находить закономерности, на основе которых можно выявить основные психологические и поведенческие характеристики целевой аудитории, ее интересы и профессиональные увлечения, а также определить особенности формирования единого портрета интересующего регион пользователя, т.е. будущего студента вуза.
Цель Проекта
Исследование возможностей анализа больших пользовательских данных из социальных сетей для выявления, привлечения и закрепления талантливой молодёжи в региональных вузах.
Задачи Проекта
- Сбор гетерогенных данных из различных источников социальной сети «Вконтакте», их структурирование и определение ключевых метаданных.
- Анализ полученных данных и разработка комплексной модели потенциального абитуриента для региональных вузов (на примере ТГУ) на основе специфических социальных, демографических, коммуникативных и поведенческих признаков пользователя «Вконтакте».
- Создание инструментов для прикладного использования комплексной системы анализа данных социальных сетей в образовательном маркетинге для привлечения к поступлению и закреплению в региональных вузах талантливой молодёжи.
Сроки реализации проекта
2017-2018 гг.
Руководитель проекта
Можаева Г.В. кандидат исторических наук, доцент, зав. каф. гуманитарных проблем информатики, директор ИДО ТГУ
Исполнители проекта
- Суханова Е.А., кандидат педагогических наук, доцент, заместитель директора НОЦ «Институт инноваций в образовании» ТГУ.
- Фещенко А.В., старший преподаватель каф. гуманитарных проблем информатики, заведующий учебно-научной лабораторией компьютерных средств обучения.
- Захарова У.С., кандидат филологических наук, специалист по научно-методической работе ИДО ТГУ.
- Резанова З.И., доктор филологических наук, зав. каф. общего славяно-русского языкознания и классической филологии.
- Мацута В.В., кандидат психологических наук, доцент кафедры организационной психологии факультета психологии ТГУ.
- Орлов С.А., канд. физ.-мат. наук, Директор межрегионального супервычислительного центр ТГУ (2017 год).
Новизна и оригинальность
Новизна предложенного подхода по оценке образовательного потенциала абитуриентов заключается в анализе их цифровых следов из социальных сетей, в отличие от распространенной практики измерения успешности обучения по формальным достижениям (ЕГЭ, олимпиады и пр.). Данный подход позволяет прогнозировать наличие высокого образовательного потенциала абитуриента до подачи им заявления в вуз, без трудоёмких традиционных диагностик когнитивных способностей, без ограничений по месту проживания абитуриентов и его удаленности от вуза, с высокой скоростью и точностью прогнозирования. Данные о потенциальных абитуриентах из социальной сети используемые для реализации подхода являются открытыми, накопленными в течении значительного периода времени (в среднем 3-8 лет). Междисциплинарное исследование по выявлению взаимосвязи цифровых следов с когнитивными особенностями личности проведено с помощью методов психодиагностики, профайлинга, компьютерной лингвистики, компьютерных наук (алгоритмы машинного обучения и datamining ), социально сетевого анализа, математического анализа. Комбинация методов анализа данных для достижения цели проекта является оригинальной.
Результаты реализации проекта
- Изучены возможности и разработаны инструменты сбора больших открытых данных о пользователях социальных сетей на примере русскоязычной сети «Вконтакте» для выявления абитуриентов с высоким образовательным потенциалом. Сформирован и открыт для исследователей обезличенный набор данных по абитуриентам Сибирского федерального круга за 2017 г. (128 тыс. пользователей), за 2018 г. (302 тыс. пользователей). Доступ к данным предоставляется по запросу на сайте http://opendata.university.
- Изучен информационный потенциал пользовательских данных из «Вконтакте» для выявления образовательных интересов школьников по их подпискам на тематические сообщества. Разработана прогностическая модель позволяющая с высокой точностью классифицировать абитуриентов по их подпискам «Вконтакте» по интересным им направлениям подготовки до подачи ими заявлений о поступлении в приёмные комиссии вузов. Проверка модели на 5 тыс. абитуриентов СФО показала точность прогнозирования интересов к профессиональному образованию в области гуманитарных наук 81%, точных наук – 93%, естественных наук – 83%.
- Подтверждена гипотеза о возможности формализации сведений об интересах пользователей социальной сети «Вконтакте» к той или иной предметной области через автоматическую классификацию текстов, опубликованных в личных профилях пользователей «Вконтакте».
- Выявлена взаимосвязь признаков одаренности у старшеклассников с их подписками на тематические сообщества «Вконтакте». Разработана оригинальная математическая модель прогнозирования наличия признаков одаренности. Проверка модели показала точность прогнозирования у абитуриентов высокого уровня интеллекта (юноши 69%, девушки 57%), креативности (юноши 83%, девушки 78%), мотивации (юноши 90%, девушки 82%).
- Проверено предположение о наличии особенностей в структуре социальных связей у одаренных старшеклассников с помощью метода анализа социальных сетей (social network analysis) и изучены возможности визуализации сетевых взаимодействий потенциальных абитуриентов в социальной сети «ВКонтакте».
- Разработана модель целевого абитуриента для регионального вуза на примере ТГУ на основе пользовательских данных старшеклассников из «Вконтакте». В 2017 году модель и алгоритм апробированы для набора в ТГУ перспективных абитуриентов для гуманитарных направлений подготовки. В 2018 году применение модели позволило обеспечить набор 243 абитуриентов (11% от общего набора студентов на 1 курс бакалавриата в ТГУ).
- Изучены факторы, определяющих выбор абитуриентом вуза и образовательной программы на основе материалов из социальных сетей, что позволило уточнить представление о особенностях поиска и выбора абитуриентами образовательных программ и организаций, выделить 28 тем-триггеров для целевой аудитории и разработать методику эффективной маркетинговой коммуникации с абитуриентами «Вконтакте».
- Описаны особенности коммуникации университета с перспективными абитуриентами в социальной сети, которые заключаются в адаптации рекламных кампаний под культурные особенности молодого поколения и жанровые особенности контента в социальных сетях. Сравнение контрольной группы абитуриентов (найденных и привлеченных через «Вконтакте») с общим контингентом абитуриентов показал среднее увеличение доли поступивших абитуриентов от подавших заявления по всем программам на 68%.
Результаты, полученные при реализации проекта, в целом соответствуют мировому уровню. Они описаны в 13 работах, в том числе в 11 статьях, опубликованных в индексируемых изданиях (включая Web of Science и/или Scopus), представлены на 6 конференциях. Результаты исследования в 2018 г. успешно защищены магистрантами Института человека цифровой эпохи ТГУ Корепановым К.В. и Ошевой М.С.
Конференции
- Международная научно-практическая конференция «Информационные технологии в гуманитарных науках» (Красноярск, сентябрь 2017), доклад «Анализ больших данных в решении образовательных задач» на секции «DH: традиции и инфраструктура».
- Международная конференция «International Conference on Education and New Learning Technologies» (Испания, июль 2017), доклад «RECRUITING UNIVERSITY ENTRANTS VIA SOCIAL NETWORKS» на секции «COMPUTER SUPPORTED COLLABORATIVE WORK».
- Международная конференция в области новых образовательных технологий в среднем, высшем и профессиональном образовании «EdCrunch Томск» , секционный доклад (Россия, Томск, 30 мая - 1 июня 2018), доклад «Выявление талантливой молодежи и привлечения в региональные вузы на основе анализа больших данных в социальных сетях» на исследовательской сессии«Большие данные в образовании».
- 12th International Technology, Education and Development Conference (INTED2018), March 5th-7th , 2018 – Valencia, Spain, секционный доклад «MODELLING OF AN EDUCATIONAL PROFILE OF A STUDENT BY ANALYZING PUBLIC USER DATA FROM SOCIAL NETWORKS», виртуальное участие.
- Международная конференция в области новых образовательных технологий в среднем, высшем и профессиональном образовании «#EDCRUNCH2018: Данные, которые трансформируют» (Россия, Москва, октябрь 2018), доклад «Предсказание когнитивных способностей учащихся по цифровым следам в социальной сети» на исследовательской кейс-сессии «Цифровой университет» .
- Международная научная конференция о настоящем и будущем онлайн-образования «eLearning Stakeholders and Researchers Summit 2018» (Россия, Москва, декабрь 2018), доклад «Моделирование признаков одаренности учащихся по цифровым следам в социальной сети «ВКонтакте» на исследовательской кейс-сессии «Психометрика и аналитика онлайн-обучения».
Публикации по результатам проекта
- Гойко В.Л., Киселев П.Б., Суханова Е.А., Фещенко А.В., Мацута В.В. Методы и инструменты привлечения перспективных абитуриентов в вуз через социальные сети// Открытое и дистанционное образование, 2017, 4, c. 45-52.
- Можаева Г.В., Фещенко А.В. Анализ больших данных в решении образовательных задач// Информационные технологии в гуманитарных науках: тез. докл. науч.-практ. конф., 2017, c. 49-50
- Мацута В.В., Киселев П.Б., Фещенко А.В., Гойко В.Л. Исследование потенциала социальных сетей для выявления одаренных старшеклассников//Психология и Психотехника, 2017, 4, c.104-121
- Фещенко А.В., Степаненко А., Гойко В.Л. Recruiting university entrants via social networks// EDULEARN17 Proceedings 9th International Conference on Education and New Learning Technologies, 2017, c.6077-6082
- Можаева Г.В., Фещенко А.В., Слободская А.В. Информационный потенциал социальных сетей для выявления образовательных потребностей школьников// Открытое и дистанционное образование, 2017, 67, c.25-30
- Фещенко А.В., Васюков К.Л., Ошева М.С. Определение образовательных интересов пользователей социальной сети “ВКонтакте” через анализ тематических сообществ// Информационные технологии в гуманитарных науках: тез. докл. науч.-практ. конф., 2017, c.60-61
- Фещенко А. В. Определение образовательных интересов школьников на основе анализа пользовательских данных «Вконтакте»// Гуманитарная информатика, 2017, 13, c.84-89
- Степаненко А.А., Шиляев К. С., Резанова З. И. Атрибуция профессиональных интересов пользователей социальной сети «ВКонтакте» на основе текстов тематических групп и персональных страниц// Вестник Томского государственного университета. Филология. , 2018, 52, c.130–144
- Васюков К.Л., Ошева М.С., Фещенко А.В. Университет в поисках своего абитуриента в социальных сетях: маркетинговые и технологические задачи// Гуманитарная информатика, 2018, 14
- Можаева Г.В., Суханова Е.А., Фещенко А.В.Привлечение и удержание университетами абитуриентов с высоким образовательным потенциалом с помощью анализа открытых пользовательских данных социальной сети «ВКонтакте»// Открытое и дистанционное образование, 2018, 72, с.52-58
- Кабанова Т.В., Корепанов К.В., Мацута В.В., Можаева Г.В., Фещенко А.В. Моделирование признаков одаренности учащихся по цифровым следам в социальной сети «ВКонтакте»// eLearning Stakeholders and Researchers Summit 2018, 2018, c.111-118
- Feshchenko A., Goiko V. , Matsuta V. , Stepanenko A. , Kiselev P. Modelling of an educational profile of a student by analyzing public user data from social networks//INTED2018 Proceedings, 12th International Technology, Education and Development Conference, 2018, March 5th-7th , 2018 – Valencia, Spain, c.640-646
- Степаненко А.А., Резанова З.И., Гойко В.Л. Автоматическая классификация контента персональных страниц пользователей социальной сети «Вконтакте» как маркеров профессиональных интересов абитуриента // Гуманитарная информатика 2018, 15
Электронные СМИ о проекте
- Журнал для абитуриентов "Postupi.online" новость от 19.12.2018
"Российские вузы начали "вербовать" абитуриентов в социальных сетях"
- "Вести-Томск", выпуск от 9.07.2018,
репортаж "Группа томских исследователи пытается найти взаимосвязь между способностями человека из содержанием его страницы в соцсетях"
- Телеканал "Россия К" и Ассоциация "Science Slam Россия". Телепроект о науке – "Научный стенд-ап"Эфир 27.10.2018
"Если вы талантливый старшеклассник и при этом активный пользователь соцсетей, не сомневайтесь она уже всё про вас знает ..."
- Информационное агентство "ТАСС", новости рубрики в рубрике "Экономика и бизнес" от 15.07.2018
"Участники "Острова 10-21" предложили проекты для технологии блокчейн в лабораториях X-labs На лабораторных работах преподают ученые из ведущих университетов и компаний, занятые в области цифровой экономики"
- "Учительская газета" новость от 12.07.2018
"Томский госуниверситет ищет абитуриентов, анализируя их подписки в соцсетях"
- Интеллектуальный журнал о культуре и обществе "НОЖ" от 10.07.2018
"В Томске отбирают одаренных абитуриентов с помощью искусственного интеллекта"
- The Question
"Можно ли по пабликам «ВКонтакте» определить интеллект пользователя?"
- Пресс-служба ТГУ новость от 04.07.2018
"В ТГУ выявили, какие группы «Вконтакте» нравятся одаренным школьникам"
- Пресс-служба ТГУ новость от 19.10.2017
"Точность программы ТГУ по поиску «своего» абитуриента в соцсетях – 82%"
- Общественное телевидение России новость от 30.03.2017
"В ТГУ предлагают выявлять предрасположенность абитуриентов к специальностям по их записям в соцсетях"