УДК 004

Использование метода главных компонент и множественной линейной регрессии при разработке программного обеспечения для построения прогноза потребления энергоресурсов

Киндибулатова Маргарита Ильдаровна – магистрант Уфимского университета науки и технологий

Аннотация: В статье анализируется использование метода главных компонент и множественной линейной регрессии при разработке программного обеспечения для построения прогноза потребления энергоресурсов. Рассматриваются особенности системы прогноза потребления и поставок энергоресурсов. Выявляются возможности факторного и многофакторного регрессионного анализа для построения прогноза потребления энергоресурсов. Приводятся правила выбора и группы входных факторов, использующиеся для работы программного обеспечения.

Ключевые слова: прогноз потребления энергоресурсов, план поставок, программное обеспечение, метод главных компонент, метод множественной линейной регрессии.

Приобретение и использование энергетических ресурсов – один из факторов формирования себестоимости и конкурентоспособности продукции [1]. При этом энергоресурсы невозможно накапливать в достаточных для производственных нужд количествах, а переход к альтернативному энергоснабжению в настоящее время носит локальный характер. Оптимизация производственных расходов требует максимально оперативного и точного учета энергоресурсов, который позволит прогнозировать их потребление и составлять планы поставок [2]. Для рационального распределения расходов энергоресурсов и автоматического анализа их потребления могут использоваться автоматизированные системы контроля и учета. Значимость прогнозирования потребления энергоресурсов для оптимизации производственной деятельности обуславливает актуальность создания соответствующего программного обеспечения.

Целью работы является изучение особенностей использования метода главных компонент и множественной линейной регрессии при разработке программного обеспечения для построения прогноза потребления энергоресурсов. Для ее достижения были использованы аналитический, синтетический, индуктивный и дедуктивный методы обработки тематических исследований, научных публикаций и релевантных литературных источников.

Энергопотребление энергосистемами и комплексами является сложной системой, для исследования которой необходим системный подход, основанный на методе математического моделирования [3]. Для достижения необходимой точности моделирования необходимо использование большого числа входных данных, которые в целях достижения общих результатов при сохранении их достоверности требуется ограничивать надежными значениями, характерными для широкого ряда устройств.

Прогнозирование потребления энергоресурсов представляет собой сложное динамическое явление, отличающееся многофакторностью, наличием детерминированной и случайной составляющих и компонента неопределенности развития окружающей среды предприятия [4]. Математическая формализация данного процесса предполагает взаимоувязку в математической модели ряда ключевых показателей при изначально большом количестве учитываемых переменных.

Характерной чертой системы прогноза потребления и поставок энергоресурсов является мультиколлинеарность – высокая взаимная корреляция объясняющих переменных [5]. В рассматриваемой задаче мультиколлинеарность чаще проявляется в стохастической форме, когда между по меньшей мере двумя используемыми факторами существует тесная корреляционная связь.

Для изучения стохастических взаимосвязей случайных величин на основе анализа корреляций между ними используется факторный анализ [6]. Он позволяет находить новые признаки, характеризующие объекты наблюдения, на основе информации, содержащейся в измеренных значениях исходных признаков. Несмотря на существующую связь с наблюдаемыми признаками, новые факторы неизвестны и нуждаются в идентификации.

Одной из разновидностей факторного анализа является метод главных компонент, в котором простые факторы предполагаются взаимно независимыми в рассматриваемой выборке [7]. Основная модель этого метода имеет следующий вид:

image001

где zp (= 1, …, m) – независимые переменные с дискретными значениями zpj (= 1, …, n); ωip – весовые коэффициенты.

Метод главных компонент используется для определения набора нагрузок по выборочным значениям наблюдаемых переменных, что позволяет выписать конкретные уравнения относительно факторов [8]. После этого осуществляется ортогональное преобразование нагрузок и факторов, позволяющее найти нагрузки и факторы, позволяющие описать наблюдаемые переменные уравнением с наименьшим количеством факторов. Метод главных компонент позволяет дать оценку полной общности системы энергопотребления в максимальном приближении к полной выборочной дисперсии.

Помимо этого, для анализа факторов, влияющих на потребление энергоресурсов, используется линейная модель множественной регрессии, имеющая вид [9]:

image002

где α0, α1, …, αp – параметры.

Для использования линейной модели множественной регрессии требуется оценить коэффициенты регрессии [10]. Пусть имеется n наблюдений вектора объясняющих переменных = (X1; X2; …; Xm) и зависимой переменной Y:

image003

Если n = m + 1, то оценки коэффициентов рассчитываются единственным образом и m – количество объясняющих переменных.

Если n < m + 1, то система имеет бесконечное множество решений.

Если n > m + 1, то невозможно подобрать линейную функцию, которая бы точно удовлетворяла всем наблюдениям, поэтому модель нуждается в оптимизации путем нахождения оценок ее параметров, при которых линейная функция будет давать наилучшее приближение для имеющихся наблюдений.

Множественная регрессия позволяет получить аналитическое уравнение изменения потребления энергоресурсов и оценить степень влияния отдельных факторов, что делает данный метод оптимальным для краткосрочного и среднесрочного прогнозирования [11]. Модель множественной регрессии хорошо отражает реальное изменение энергетических нагрузок, а ее адаптация позволяет включить в прогноз потребления и поставок энергоресурсов зависимости от дополнительных факторов, таких как направленность проводимых на предприятии технических мероприятий.

Эффективность работы программного обеспечения для прогнозирования потребления и поставок энергоресурсов зависит от подбора изначальных данных. Выбор входных факторов может осуществляться на основе следующих правил [12]:

  • возможность проверяемости данных в открытых источниках;
  • неизменность методологии сбора и обработки статистических данных на протяжении всего анализируемого периода;
  • наличие в данных не менее двух независимых погодных факторов;
  • связанность статистических факторов с объемами потребления энергоресурсов, не обязательно носящая определяющий характер.

Набор входных данных может различаться в зависимости от системы. Для создания прогнозной функции энергопотребления необходимо использовать несколько групп изменяющихся факторов, выбирая среднее значение за период наблюдений [13]:

  • технические и технологические: число часов работы основных энергопотребителей, объемы потребления энергоресурсов, средневзвешенная по объему температура и относительная влажность воздуха внутри производственных помещений;
  • климатические и климатологические: градусо-сутки отопительного периода, температура и относительная влажность наружного воздуха, атмосферное давление, скорость и направление ветра, облачность, продолжительность светового дня;
  • социальные: суммарное число рабочих часов, дифференциация рабочих и нерабочих дней, число посетителей, суммарное ежемесячное число часов нахождения посетителей в здании, численность населения, продолжительность времени работы предприятия;
  • экономические: стоимость энергоресурсов и ее динамика за период проведения анализа;
  • социально-экономические: реальные денежные доходы населения, численность пенсионеров, удельный вес расходов домашних хозяйств на оплату жилищно-коммунальных услуг, валовой региональный продукт на душу населения, конечное потребление домашних хозяйств на душу населения, индексы промышленного производства и другие.

Таким образом, в основе программного обеспечения для построения прогноза потребления и плана поставок энергоресурсов может лежать многофакторный регрессионный анализ, входные факторы для которого должны удовлетворять ряду требований, таких как проверяемость в открытых источниках, неизменность методологии, наличие не менее двух независимых погодных факторов и связанность с объемами потребления энергоресурсов. Подобное программное обеспечение позволит получить аналитическое уравнение динамики энергопотребления и оценить уровень влияния отдельных факторов. Для повышения качества прогноза можно использовать более совершенные формы моделирования, основанные на учете дополнительных факторов, таких как направленность технических мероприятий, при соответствующей корректировке коэффициентов регрессии.

Список литературы

  1. Конюхов В.Ю., Опарина Т.А., Ше Сон Гун. Энергоменеджмент как эффективная система энергосбережения и решение проблем ее внедрения // Известия вузов. Инвестиции. Строительство. Недвижимость. – 2020. – Т. 10, № 4. – С. 534-543. – DOI: 10.21285/2227-2917-2020-4-534-543
  2. Богатенков Д.А., Чайковский В.М. Система контроля и учета электроэнергии промышленного предприятия // Вестник Пензенского государственного университета. 2022. № 2. С. 70-75.
  3. Гужов С.В. О прогнозировании спроса на электроэнергию энергосистемами регионов Российской Федерации с применением искусственных нейронных сетей // Известия Транссиба. – 2020. – № 1 (41). – С. 133-140.
  4. Кокшаров В.А. Концептуальный подход к формированию системы моделей для реализации стратегий эффективного использования энергетических ресурсов на промышленном предприятии // Инновации и инвестиции. – 2021. – № 6. – С. 34-39.
  5. Кремер Н.Ш. Эконометрика: учебник и практикум для вузов / Н.Ш. Кремер, Б.А. Путко; под ред. Н.Ш. Кремера. – 4-е изд., испр. и доп. – М.: Изд-во Юрайт, 2023. – 308 с.
  6. Анализ данных: учебник для вузов / В.С. Мхитарян [и др.]; под ред. В.С. Мхитаряна. – М.: Изд-во Юрайт, 2023. – 490 с.
  7. Берикашвили В.Ш. Статистическая обработка данных, планирование эксперимента и случайные процессы: учеб. пособие для вузов / В.Ш. Берикашвили, С.П. Оськин. – 2-е изд., испр. и доп. – М.: Изд-во Юрайт, 2023. – 164 с.
  8. Ковалев Е.А. Теория вероятностей и математическая статистика для экономистов: учебник и практикум для вузов / Е.А. Ковалев, Г.А. Медведев; под общ. ред. Г.А. Медведева. – 2-е изд., испр. и доп. – М.: Изд-во Юрайт, 2023. – 284 с.
  9. Эконометрика: учебник для вузов / И.И. Елисеева [и др.]; под ред. И.И. Елисеевой. – М.: Изд-во Юрайт, 2023. – 449 с.
  10. Галочкин В.Т. Эконометрика: учебник и практикум для вузов / В.Т. Галочкин. – М.: Изд-во Юрайт, 2023. – 293 с.
  11. Капанский А.А. Методы решения задач оценки и прогнозирования энергетической эффективности // Вестник Казанского государственного энергетического университета. – 2019. – Т. 11, № 2 (42). – С. 103-115.
  12. Гужов С.В. Прогнозирование спроса на тепловую энергию для зданий средних образовательных учреждений на основании свойств гетероморфизма их энергосистем // Известия высших учебных заведений. Проблемы энергетики. – 2020. – Т. 22, № 5. – С. 18-27. – DOI: 10.30724/1998-9903-2020-22-5-18-27
  13. Гужов С.В. Прогнозирование спроса на электрическую энергию изолированной энергетической системой города // Энергетическая политика. – 2020. – № 6 (148). – С. 50-57.

Интересная статья? Поделись ей с другими: