В статье описана авторская методика подготовки исходных данных для формирования портрета потребителя продуктов питания в Калининградской области –эксклавном регионе России для дальнейшего моделирования на основе корреляционно-регрессионного метода.
Ключевые слова: информационное обеспечение, моделирование, портрет потребителя, корреляционно-регрессионный метод, продукты питания, Калининградская область.
Статистическая модель потребителя продуктов питания — жителя Калининградской области, строится на основе регрессионного моделирования зависимости расходов на питание от факторов, определяющих спрос на пищевые продукты в Калининградской области по состоянию на октябрь 2014 года, и разрабатывается на базе социологического опроса респондентов — жителей Калининградской области на основе репрезентативной выборки. Модель позволяет прогнозировать спрос как на краткосрочную перспективу, так и на среднесрочный и долгосрочный временные периоды, в частности, для получения целевых показателей производства конечной продукции АПК Калининградской области (КО), в том числе с учетом изменения доходов населения, его половозрастного состава, изменения его предпочтений, например, с учетом повышения спроса на экологически чистые продукты питания.
Методика моделирования спроса путем анализа и прогнозирования портрета потребителя продуктов питания КО методом корреляционно-регрессионного анализа, базируется на авторской методике, описанной в [1]. Первые четыре этапа этой методики направлены на формирование информационной базы моделирования.
1) Подбор факторов, оказывающих наиболее существенное влияние на спрос. Может осуществляться на базе экспертного опроса, экспертного метода ранжирования альтернатив и оценки согласованности мнений экспертов. В качестве экспертов выступали сотрудники БФУ им. И.Канта, д.э.н, профессор Левина Р.С., к.э.н., доцент Лукьянова Н.Ю., к.э.н., доцент Никифорова И.В. При моделировании были использованы, как количественные, так и качественные показатели.
Спрос на пищевые продукты определялся фактором “Средние расходы на продукты питания на одного члена семьи в месяц” в рублях. Экспертным путем в качестве основного фактора, определяющего спрос, был отобран фактор “Душевой доход в месяц на члена семьи (руб.)”, в качестве дополнительных факторов, характеризующих портрет потребителя, выступили:
- процент трат на питание в структуре общих расходов респондента (%);
- возраст респондента, делающего покупки продуктов питания (лет);
- наличие семьи (совместное ведение домохозяйства) (качественный показатель);
- количество детей до 18 лет в семье (человек);
- пол респондента, делающего покупки продуктов питания (качественный показатель);
- место проживание респондента (качественный показатель);
- ограничения в потреблении продуктов питания (качественный показатель);
- дифференциация продукции по стране-производителю (качественный показатель);
- предпочтение отдается отечественным продуктам питания (качественный показатель);
- приобретается ли часть продуктов за границей (качественный показатель);
- дифференциация продукции по экологичности (качественный показатель);
- предпочтение отдается продуктам питания без добавок (качественный показатель);
- готовность доплачивать за экологически чистые продукты (качественный показатель).
2) Формирование репрезентативной выборки. Определение параметров выборки проводилось совместно Е.С. Фидрей — руководителем Социологической лаборатории анализа рисков БФУ им. И. Канта. В результате была сформирована 0,05 % выборка из генеральной совокупности населения КО для уточнения потребительского спроса на продукцию АПК в КО. В частности объем выборки составил 500 респондентов.
Таким образом, была сформирована репрезентативная по структуре выборка, включающая разные половозрастные группы, разные доходные группы, представителей разных зон проживания КО, а также из городов и сельской местности, пропорционально структуре жителей КО.
В частности репрезентативность по территориальному принципу обеспечивалась, тем, что были опрошены жители трех районов г. Калининграда (Центрального, Московского и Ленинградского), жители городских округов, а также городские и сельские жители курортной зоны проживания, средней и дальней периферии. Репрезентативность по возрастному принципу обеспечивалась отбором респондентов из шести возрастных категорий: 18-24 года, 25-34 года, 35-44 года, 45-54 года, 55-64 года, а также 65 лет и старше. Репрезентативность по гендерному принципу обеспечивалась отбором в указанных возрастных группах примерно одинакового числа респондентов мужского и женского пола. Результаты опроса подтвердили репрезентативность выборки и по доходу, поскольку в опросе приняли участие респонденты разных групп по уровню среднемесячного дохода в расчете на одного члена семьи: малообеспеченные (до 5000 руб.), обеспеченные ниже среднего уровня (от 5 до 10 тыс. руб.), средний уровень (от 11 до 20 тыс. руб.), выше среднего уровня (свыше 20 тыс. руб.).
3) Разработка анкеты. Разработка анкеты для опроса респондентов с целью выявления потенциального спроса среднесрочном периоде и на долгосрочную перспективу проводилась совместно с Е.С. Фидрей, сбор данных и формирование первичного массива данных в среде Excel™ осуществляли сотрудники Социологической лаборатории анализа рисков БФУ им. И. Канта, всего было собрано 493 анкеты.
4) Анализ и подготовка данных к моделированию. Осуществлялись с учетом ограничений и условий применения регрессионного метода, включали технический контроль и логический контроль, редактирование (восстановление) данных, кодирование данных, а также формирование рядов факторов для регрессионного моделирования. Всего для моделирования было отобрано 460 анкет.
В частности, технический контроль заключался в удалении дублирующихся анкет, анкет с опечатками (например, возраст респондента 2 года) и анкет с пропусками данных, которые не возможно достоверно восстановить.
Логический контроль заключался в проверке анкет на наличие логических ошибок, например, превышение расходов на продукты питания над доходами.
Редактирование (восстановление) данных заключалось в формировании пропущенных данных. Например, при отказе респондента предоставить сведения о душевом доходе в месяц на члена семьи (руб.), респондент относил себя к конкретной доходной группе: малообеспеченные (до 5000 руб.), обеспеченные ниже среднего уровня (от 5 до 10 тыс. руб.), средний уровень (от 11 до 20 тыс. руб.), выше среднего уровня (свыше 20 тыс. руб.), что позволяло восстановить его доход с учетом правил статистической группировки.
Кодирование данных представляло собой формирование значений фиктивных переменных для неколичественных факторов, формирующих спрос. Значения кодов фиктивных переменных представлено в таблице.
Формирование рядов факторов для регрессионного моделирования заключалось в уточнении фактора “средние расходы на продукты питания на одного члена семьи в месяц” (руб.), а также проверке распределений факторов на допустимый уровень вариации и на близость распределений факторов к нормальному закону.
Уточнение фактора “средние расходы на продукты питания на одного члена семьи в месяц” (руб.), заключалось в получении достоверных значений фактора по каждому респонденту по следующей методике. Сначала по каждому респонденту определялось значение расходов с учетом процента трат на питание (вопрос анкеты: “Какую часть ежемесячного дохода семьи, Вы тратите на питание?”), доходов и количества членов семьи. Затем по каждому респонденту определялось значение расходов через средний чек (вопрос анкеты: “Назовите сумму средней разовой покупки продуктов питания?”) и частоту покупок (вопрос анкеты: “Как часто Вы покупаете продукты питания?”). Затем определялась средняя арифметическая этих двух значений. В результате был получен более достоверный ряд распределения фактора “средние расходы на продукты питания на одного члена семьи в месяц” (руб.), что было подтверждено на стадии логического контроля. Анализ показал, что наименьшее отклонение фактора расходов от среднего значения наблюдалось у семейных женщин в возрасте от 35 до 54 лет, имеющих детей в возрасте до 18 лет. Наибольшее отклонение продемонстрировали пожилые люди, молодежь, а также одинокие мужчины среднего возраста.
Таблица1
Кодирование качественных факторов для моделирования
Показатель |
Коды |
Процент трат на питание в структуре общих расходов респондента |
1 – тратит более 50% доходов, 0 – тратит менее 50% доходов |
Наличие семьи (совместное ведение домохозяйства) |
1-проживающий в семье, 0-одинокий |
Пол респондента, делающего покупки продуктов питания |
1- мужчина, 0- женщина |
Место проживание респондента |
1-городской житель, 0-сельский житель |
Ограничения в потреблении продуктов питания |
1-ограничивают, 0-не ограничивают |
Дифференциация продукции по стране-производителю |
1-имеет значение, 0-нет |
Предпочтение отдается отечественным продуктам питания |
1-да, 0-нет |
Приобретается часть продуктов за границей (Польша, Литва, Германия) |
1-да, 0-нет |
Дифференциация продукции по экологичности |
1-имеет значение, 0-нет |
Предпочтение отдается продуктам питания без добавок |
1-да, 0-нет |
Готовность доплачивать за экологически чистые продукты |
1-да, 0-нет |
Проверка распределений факторов на допустимый уровень вариации и на близость распределений факторов к нормальному закону проводилась путем расчета коэффициентов вариации, асиммметрии и эксцесса для каждого распределения количественно измеряемых факторов:
- средние расходы на продукты питания на одного члена семьи в месяц (руб.);
- душевой доход в месяц на члена семьи (руб.);
- процент трат на питание в структуре общих расходов респондента (%);
- возраст респондента, делающего покупки продуктов питания (лет);
- количество детей до 18 лет в семье (человек).
После проведенной проверки был сделан вывод о возможности использования данных 460 анкет для построения регрессионной модели портрета потребителя продуктов питания жителей Калининградской области.
В заключении отметим, что работа выполнялась в рамках проекта “Создание университетской информационно-аналитической системы поддержки региональных социально-экономических исследований и ее внедрение в научную, образовательную и инновационную деятельность БФУ им. И. Канта (Этап 1)” по Программе развития БФУ им. И. Канта на 2011 - 2020 годы. Автор выражает благодарность за помощь, оказанную в проведении исследования, сотрудникам Социологической лаборатории анализа рисков БФУ им. И. Канта, ее руководителю Е.С. Фидре, а также коллегам И.В. Никифоровой и Р.С. Левиной, без которых настоящее исследование не было бы возможным. Результаты моделирования спроса на продукты питания жителей Калининградской области в настоящее время автор готовит к публикации.
Литература:
1. Лукьянова Н.Ю., Соколова А.А. Моделирование портрета потребителя в непроизводственной сфере экономики. /Материалы Международной научной школы-семинара "Системное моделирование социально-экономических процессов" имени академика С.С.Шаталина.- Воронеж: ИПЦ ВГУ. 2011. С.93-94.