Формирование рекомендаций для изучения новых навыков на основе ассоциативных правил

Ложкин Сергей Сергеевич – бакалавр кафедры Информационных систем Муромского института (филиала) Владимирского государственного университета имени Александра Григорьевича и Николая Григорьевича Столетовых.

Аннотация: Ассоциативный анализ данных позволяет сформировать правила использования наборов навыков. Применение подобного подхода к рекомендациям обусловлен стремительным изменениям рынка труда в расширении поле деятельности вакансий. Что за частую приводи к размытости вектора направления развития вакансий.

Ключевые слова: Подбор навыков, анализ данных, ассоциативный анализ, методика.

В современных базах имеются большие выбор вариантов вакансий. Основной задачей перед данными базами стоит в предоставлении информации о вакансии соискателю. И из-за того, что эти базы большие человеку ищущий работу необходимо проводить большое количество времени в поисках подходящий вакансии. А также поиска технологии или навыка необходимых для изучения с целью саморазвития. Для данных задач предлагается использование ассоциативного анализа.

В случаи если структурировать данные о вакансиях в виде таблицы:

Таблица 1. Вакансии с сопоставлением навыков.

Номер вакансий

Наименование навыков

1

A

1

D

1

E

2

A

2

F

3

B

3

A

3

C

Алгоритм работает в два этапа. На первом этапе находит часто встречающиеся навыки, на втором, извлекает правила.

На первом этапе возможно сформировать все возможные наборы навыков. Путем формирования иерархического дерева. После чего производить подсчет частоту появления (поддрежку) n – набора в списке вакансий.

Свойству можно дать формулировку: с ростом размера набора навыков поддержка уменьшается, либо остается такой же. Из всего вышесказанного следует, что любой n-элементный набор будет часто встречающимся тогда и только тогда, когда все его (k-1)-элементные подмножества будут часто встречающимися.

В некоторых случаях, когда имеется представление о желаемом результате, а именно достоверности результатов и его поддержки построение некоторых ветвлений до нижнего уровня не целесообразно.

В качестве иллюстрации рассмотрим набор из навыков {SQL, Linux, Kotin, PHP}. В случае, если набор из навыков {SQL, Linux} имеет поддержку ниже заданного порога и, соответственно, не является часто встречающимся. В результате расчета показателей поддержки и достоверности данных возможно сформировать ассоциативные правила [1].

1

Рисунок 1. Иллюстрирующий набор навыков.

Следующие этапы будут состоять из двух частей: генерации потенциально часто встречающихся наборов навыков и подсчета поддержки для набора.

Основными показателями расчета ассоциативного анализа являются: поддержка и достоверность.

Поддержка – это количество или процент вакансий содержаний n-набор навыков. 

Достоверность – отношение количества вакансий удовлетворяющие наличие выбранного n – набора к общему количеству [2].

Финальным этапом является удаление ветвей избыточности. Из полученных наборов удаляются те что не прошли минимальных интересующий порог.

Чтобы извлечь правило из часто встречающегося n - набора, следует найти все его непустые подмножества. И для каждого подмножества мы сможем сформулировать правило вида если «а», следовательно, «Б» [3].

Стоит отметить что при применении ассоциативного анализа не учитывается приоритетность навыков. Тем самым опускается, не учитывается, что некоторые навыки соискатель может знать лучше или хуже.

На основе данных полученных в результате применении ассоциативного анализа на данные по вакансиям и навыкам можно сформировать рекомендательные советы о изучении технологий и выбора вакансий.

При анализе набора вакансий имеющая порядка 360записей получение с сайта HeadHenter следуют результаты, из которых видно, что при наличие такого навыка у соискателя как [.NET Framework] следует изучать язык программирования [C#] и данное правило имеет 81,25% достоверности. Из вакансий требующий навык [.NET Framework] (16 шт.) так же присутствуют требования по языку программирования [C#]. Или в случаи если в вакансиях требуется [HTML, JavaScript, SQL] то с вероятностью 100% требуется знание навыка [CSS].

Список литературы

  1. Зайко Т. А., Олейник А. А., Субботин С. А. Ассоциативные правила в интеллектуальном анализе данных // Вестник НТУ ХПИ. 2013. №39 (1012). URL: https://cyberleninka.ru/article/n/assotsiativnye-pravila-v-intellektualnom-analize-dannyh (дата обращения: 26.11.2020).
  2. Чубукова И.А. Data Mining / И.А. Чубакова. - М. : Бином, 2008.
  3. Srikant, R. Agrawal. «Mining quantitative association rules in large relational tables». In Proceedings of the ACM SIGMOD Conference on Management of Data, Montreal, Canada, June 1996.

Интересная статья? Поделись ей с другими: