Интеграл 5/2020

DOI 10.24411/2658-3569-2020-10101

Использование машинного обучения для развития отношений между предприятиями в промышленности

Using machine learning to develop relationships between enterprises in industry

Байсаева Малика Усамовна, доцент кафедры финансов, кредита и антимонопольного регулирования, ФГБОУ ВО «Чеченский государственный университет»

Байсаев Зубайр Исмаилович, Российская академия народного хозяйства и государственной службы при Президенте РФ

Baysaeva Malika Usamovna, Baysaev Zubayr Ismailovich,

Аннотация. В современной обрабатывающей промышленности особая роль использования больших данных обусловлена тем, что они создают прозрачную инфраструктуру для прогнозирования и совершенствования организации производства. Это объективно обусловлено тем, что сектор обрабатывающей промышленности генерирует и хранит большие объемы данных, поступающих от датчиков, чем любой другой сектор. Например, только одна машина может генерировать тысячи записей для накопления информации о производстве и работоспособности в течение одной секунды, что составляет несколько триллионов записей в год.

Аналитика этой информации имеет особое значение для реализации идеи цифрового производства, а также лежит в основе его точной настройки на удовлетворение потребностей персонализированного спроса клиентов. Кроме того, аналитика больших данных оказывает существенное влияние на НИОКР, техническое обслуживание, утилизацию товаров и переработку отходов, способствуя внедрению более экологически чистых и безопасных технологий и эффективному развитию устойчивых способов производства и потребления.

Summary. In the modern manufacturing industry, the special role of using big data is due to the fact that they create a transparent infrastructure for forecasting and improving the organization of production. This is objectively due to the fact that the manufacturing sector generates and stores more data from sensors than any other sector. For example, just one machine can generate thousands of records to accumulate production and health information in one second, which amounts to several trillion records per year.

Analyzing this information is critical to realizing digital manufacturing, and is also at the heart of fine-tuning it to meet the needs of personalized customer demand. In addition, big data analytics have a significant impact on R&D, maintenance, product recycling and recycling, contributing to cleaner and safer technologies and the efficient development of sustainable production and consumption.

Ключевые слова: цифровое производство, аналитика, информация, внедрение, промышленность.

Keywords: digital manufacturing, analytics, information, implementation, industry.

Масштабы использования больших данных растут в мире опережающими темпами (рис. 1.). Так, по данным опроса NewVantage Partners, около 85,5% предприятий планируют использование или уже применяют анализ больших данных, однако только 37,1% преуспели в этом направлении. Как отмечено в отчете Dresner Advisory Services «Big Data Analytics Market Study», в 2017 г. Большие данные в своей деятельности использовали более половины исследуемых компаний, что на 36% больше, чем в 2015 году.

С технологических позиций организация использования больших данных подразумевает, во-первых, системную инфраструктуру, которая обеспечивает сбор, передачу, хранение и вычисление данных в распределенной среде, и, во-вторых, – собственно аналитику этих данных: дескриптивну (описательную) (англ. Descriptive Analytics), предиктивну (прогностическую) (англ. Predictive Analytics) и прескриптивну (распорядительную) (англ. Prescriptive Analytics) [2].

Системная инфраструктура. Первичная информация охватывает данные сенсоров, системных журналов (лог-файлов, которые содержат системную информацию о действиях пользователей в хронологическом порядке), изображения видеокамер, записи радиочастотной идентификации (RFID), данные систем глобального позиционирования (GPS), планирования ресурсов предприятий (ERP) и социальных медиа [5].

Для их хранения есть поиска используются реляционные базы данных (совокупности связанной информации, сохраняемой в двумерных таблицах, с использованием для создания, модификации и управления данными языки структурированных запросов SQL – Structured Query Language), а также базы, что реализуют другие подходы:

Apache Cassandra – открытые распределенные СУБД, принадлежащие к классу NoSQL , созданная для работы с високомасштабованими и надежными хранилищами больших массивов данных;

MongoDB – документоориентированные СУБД с открытым исходным кодом класса NoSQL, которые не требуют описания схем таблиц (используемый язык программирования – C++); хранилища данных (англ. Data Warehouse) – предметно ориентированные неизменные (доступны только для чтения) базы данных, специально разработанные и предназначенные для подготовки отчетов и бизнес-анализа с целью поддержки избрания решений [1].

Большое количество данных, которое должно храниться в базах, выходит за рамки возможностей обычных компьютеров. Следовательно, для их нормальной обработки нужен либо суперкомпьютер, либо распределенные вычислительные системы (группы взаимосвязанных компьютеров). Исходя из соображений экономии, большие объемы информации обычно хранят в кластерах, где компьютеры расположены вблизи друг от друга (в одном помещении) и объединены через высокоскоростную локальную сеть (англ. Local Area Network, LAN).

Аналитика данных. На практике широкое использование находят прежде всего относительно простые дескриптивнианалитическим методом. Они оперируют такими хорошо известными статистическими показателями как среднее значение (арифметическое, геометрическое, взвешенное), медиана, мода, интервал изменения, дисперсия и тому подобное [3]. Кроме такой описательной статистики в этом классе применяют также более продвинутые методы – корреляцию (статистическую меру, которая определяет степень связи между переменными) и регрессию (описывает, как независимая переменная численно связана с зависимыми переменными), кластеризация (группировка объектов на подмножества), сложные генеративные модели (в отличие от дискриминационных моделей, предназначенных различать типы полученных извне исходных данных, они способны самостоятельно генерировать новые данные, схожие с исходными).

Предиктивная аналитика, в отличие от аналитики дескриптивной, сосредоточенной на исследовании событий прошлого, ставит задачу предвидения вероятного будущего. Как правило, она охватывает набор данных со многими известными атрибутами и несколькими целевыми атрибутами для прогнозирования [7]. Для целевых атрибутов их фактические значения доступны только для прошлых периодов, но не доступны на период планируемый. Поскольку данные являются взаимосвязанными, то с использованием различных методов можно ставить задачи поиска связей между известными атрибутами с целевыми, а затем использовать эти соотношения для прогнозирования целевых атрибутов. Используемые для этого методы прогнозирования могут быть распределены на пять типов: регрессия, дерево решений, Байесова статистика, нейронная сеть, а также метод опорных векторов. Например, популярные теперь нейронные сетевые методы относятся к методам искусственного интеллекта, используются для автоматизации процессов классификации, прогнозирования, распознавания образов, выбора решений, управления, кодирования и декодирования информации, аппроксимации зависимостей и др.

Перспективная аналитика предназначена давать ответ на вопрос «что должно произойти в будущем?»исходя из предположения о том, что те события, которые произошли в прошлом, состоятся таким же, или аналогичным образом в планируемый период. Например, ее можно использовать для прогнозирования спроса на определенный продукт. Использование этого класса аналитики в Индустрии 4.0 обычно включает в себя разнообразные самооптимизированные стратегии для достижения поставленной цели деятельности экономического субъекта в условиях динамической среды, алгоритмы самоорганизации для оптимизации функционирования автономных киберфизических систем и др. Можно выделить два типа методов предиктивной аналитики: математическое (в том числе линейное, нелинейное, стохастическое) программирования и эвристический поиск [4]. Математическое Программирование предназначено для получения единого оптимального решения, а эвристический поиск предназначен для нахождения локальных оптимальных решений проблемы субоптимальными способами.

Относительно экономических аспектов использования больших данных можно отметить, что наибольшую отдачу от их анализу предприятия и организации получают за счет сокращения расходов и использования новых возможностей для инноваций: почти 50 % опрошенных NewVantage Partners руководителей субъектов хозяйствования, относящихся к лидеров Fortune 1000, показали, что сумели уменьшить объемы операционных расходов за счет инвестиций в большие данные, 44,3 % – нашли новые возможности для инноваций, 27,9 % удалось создать и наладить эффективную систему использования больших данных и формирование соответствующей культуры (англ. Data-Driven Culture).

Специалисты из McKinsey Analytics в глобальном обзоре «Analytics comes of age», опираясь на онлайн-опроса 530 руководителей компаний учреждения высшего звена из разных регионов мира и отраслей, определили перспективные сферы бизнеса, на которые сбор, хранение и аналитика больших данных оказывают наибольшее влияние.

Как свидетельствуют результаты исследования, именно обрабатывающая промышленность является той отраслью, где аналитика больших данных может быть успешной в силу характера и объемов генерируемой ею информации [6].

Основными показателями такой методики могут стать:

а) для оценки поставщиков больших данных – количество предприятий, работающих в сфере больших данных (вендоров больших данных), объемы доходов этих компаний от производства соответствующего программного обеспечения, а также стоимость услуг, связанных со сбором, хранением и анализом больших данных;

б) для оценки потребителей больших данных – количество субъектов хозяйствования, использующих большие данные в своей деятельности (размер, виды деятельности, регионы расположения), объем расходов на большие данные, доля дохода предприятий, созданная за счет их использования.

В результате в статистические органы будет поступать информация, которую можно будет использовать для оценки развития отечественного рынка больших данных, анализа деятельности предприятий и разработки прогнозов развития экономики в условиях цифровизации. Для сбора показателей деятельности предприятий ‒ потребителей больших данных Госкомстата России нужно разработать новые статистические формы, а предприятиям – выделять, возможно, с использованием экспертных оценок, долю доходов, полученных благодаря использованию больших данных. Однако сбор статистической информации относительно нового бизнеса, созданного в сфере больших данных, вводить будет сложнее, поскольку в перечне кодов видов экономической деятельности (КВЭД) национального классификатора такого вида деятельности пока не существует. Хотя на начальном этапе такую деятельность можно было бы отнести к разделу 62 «Компьютерное программирование, консультирование и связанная с ними деятельность» секции J «Информация и телекоммуникации».

При этом целесообразно принять во внимание, что 2017 г. МВФ опубликовал исследование «Большие данные: потенциал, проблемы и статистические последствия» (англ. «Big Data: Potential, Challenges, and Statistical Implications»), в котором было предложено классификацию больших данных, что соответствует признанной макроэкономической и финансовой статистике. Для сбора более детальной информации о деятельности компаний-поставщиков больших данных можно воспользоваться, например, опытом немецкой компании Experton Group, которая разработала Методику оценки вендоров больших данных и использует ее для осуществления ежегодного мониторинга этого рынка (например, «Big Data Vendor Benchmark 2015»). Также целесообразно уточнить определение «товара» в «Классификации видов экономической деятельности ДК 009:2010» Национального классификатора России, поскольку благодаря высоким темпам распространения цифровизации товары уже давно являются не только материальными объектами – цифровые товары и программное обеспечение не нужно транспортировать в обычном смысле этого слова, однако они являются предметом покупки, продажи или обмена и не относятся к услугам.

Поскольку национальные классификаторы должны быть разработаны в соответствии с Международной стандартной отраслевой классификации всех видов экономической деятельности (англ. International Standard Industrial Classifications of All Economic Activities ISIC), можно ожидать, что уже в недалеком будущем некоторые виды экономической деятельности будет пересмотрено, другие – добавлены уточненного перечня; также будут разработаны методики по измерению влияния больших данных и других современных цифровых технологий на развитие национальной экономики.

Литература

Дащенко Ю.Ю. Цифровая экономика как экономика будущего // Тенденции развития науки и образования. 2018. № 35-1. С. 18-19.
Кошкин А.И., Короваева О.А. Цифровая экономика в россии. Современные концепции развития экономик // Аллея науки. 2018. Т. 5. № 4 (20). С. 462-466.
Перелет Р.А. Переход к экономике замкнутого цикла и цифровой экономике // Вопросы новой экономики. 2018. № 4 (48). С. 81-87.
Пяткин В.В., Колчин А.И. От информационного общества к цифровой экономике или к экономике знаний? // Вестник современных исследований. 2018. № 7.1 (22). С. 244-246.
Сурова Н.Ю., Безделов С.А. Новые технологии для экономики будущего: рейтинг проектов и механизмы регулирования в сфере цифровой экономики // Вестник Академии. 2018. № 1. С. 5-9.
Тимофеев Р.А., Минибаева Д.Р., Ехлакова Е.А. Цифровая экономика как драйвер устойчивого роста отечественной экономики // Вестник экономики, права и социологии. 2018. № 1. С. 42-45.
Харитонов С.В., Мусина Д.Р., Тюрганов А.Г. Мягкое рыночное управление экономикой региона в контексте цифровой экономики // Экономика и управление: научно-практический журнал. 2018. № 1 (139). С. 43-46.

References

Dashhenko Yu.Yu. Cifrovaya e`konomika kak e`konomika budushhego // Tendencii razvitiya nauki i obrazovaniya. 2018. № 35-1. S. 18-19.
Koshkin A.I., Korovaeva O.A. Cifrovaya e`konomika v rossii. Sovremenny`e koncepcii razvitiya e`konomik // Alleya nauki. 2018. T. 5. № 4 (20). S. 462-466.
Perelet R.A. Perexod k e`konomike zamknutogo cikla i cifrovoj e`konomike // Voprosy` novoj e`konomiki. 2018. № 4 (48). S. 81-87.
Pyatkin V.V., Kolchin A.I. Ot informacionnogo obshhestva k cifrovoj e`konomike ili k e`konomike znanij? // Vestnik sovremenny`x issledovanij. 2018. № 7.1 (22). S. 244-246.
Surova N.Yu., Bezdelov S.A. Novy`e texnologii dlya e`konomiki budushhego: rejting proektov i mexanizmy` regulirovaniya v sfere cifrovoj e`konomiki // Vestnik Akademii. 2018. № 1. S. 5-9.
Timofeev R.A., Minibaeva D.R., Exlakova E.A. Cifrovaya e`konomika kak drajver ustojchivogo rosta otechestvennoj e`konomiki // Vestnik e`konomiki, prava i sociologii. 2018. № 1. S. 42-45.
Xaritonov S.V., Musina D.R., Tyurganov A.G. Myagkoe ry`nochnoe upravlenie e`konomikoj regiona v kontekste cifrovoj e`konomiki // E`konomika i upravlenie: nauchno-prakticheskij zhurnal. 2018. № 1 (139). S. 43-46.

Международный журнал прикладных наук и технологий "Integral"

Интеграл 5/2020

Добавить комментарий Отменить ответ