Реальность это соединение новых технологий и доступности решений
Машинное обучение Машинное обучение

Для меня сегодняшний день — это точка пересечения двух различных историй из двух совершенно разных миров. Одна история из числа привычных на работе.

Главная>Машинное обучение>Научная фантастика и реальная работа
Машинное обучение Тема номера

Научная фантастика и реальная работа

Дата публикации:
20.09.2019
Посетителей:
220
Просмотров:
294
Время просмотра:
2.3

Авторы

Автор
Владимир Молодых В прошлом - руководитель Дирекции по разработке и внедрению программного обеспечения компании "Инфосистемы Джет"

Для меня сегодняшний день — это точка пересечения двух различных историй из двух совершенно разных миров.

 

Одна история из числа привычных на работе. Мы больше двух десятилетий занимаемся интеграцией данных, построением хранилищ, созданием на их базе систем поддержки решений, аналитики и т.д. В этой истории есть кейсы, истории успеха, перерасход трудозатрат на контрактах, а также поиск технологических новинок как в плане решений и технологий, так и в плане менеджмента, подходов к организации проектов. Сейчас, когда ИТ становятся все ближе к Core business у наших заказчиков и они все больше наращивают ИТ-компетенции, необходимо очень быстро бежать вперед, чтобы не отстать от них, чтобы наши технические и консалтинговые компетенции были передовыми и востребованными.

Другая история берет начало в прочитанных в детстве книгах: 3 закона робототехники, Массачусетская машина и великое кодирование, — если вы понимаете, о чем я. И эта история так же стремительно развивается. В школьные годы я обыгрывал в шахматы максимально мощный доступный мне компьютер с самой сильной программой из числа доступных мне. А сегодня мои шансы в игре с компьютером в шахматы или в го равны нулю. Мои дочери обижаются на Алису от «Яндекса», когда в разговорах та особенно им дерзит. И из каждого утюга я слышу про самую хайповую тему современности (не считая блокчейна, конечно): искусственный интеллект, «озера данных» и машинное обучение.

 

И эти два мира стремительно объединяются.

 

Почему сегодня

 

Причина объединения этих миров банальна и традиционна — экономическая целесообразность.

 

Два-три года назад мы только решили выделить машинное обучение и работу с Большими данными как направление стратегического развития. Когда мы приходили к заказчику и рассказывали про перспективный набор решений, встречали нас холодно, и я чувствовал себя торговцем «нанотехнологиями» или гербалайфом. Сейчас же, оперируя набором успешных кейсов, я чувствую себя на порядок увереннее. Причем еще 5 лет назад те же самые кейсы не сошлись бы. Раньше было дороже железо, слабее математика, меньше данных. Если по итогам внедрения машинного обучения 5 лет назад можно было заработать, условно, 100 рублей, а потратить на проект нужно было 150, проект не стартовал. Теперь же потратить нужно 80, заработать можно 120, а «железо» продолжает дешеветь и математика стремительно развиваться. Так что объединение фантастики и практики — прямое следствие научно-технического прогресса и стремления к экономической эффективности. 

Кейс 1

Федеральный банк 

Внедрение Jet Detective — AI-based-системы противодействия мошенничеству

+34%

случаев мошенничества 

оперативно выявлено 

В 5 раз

сократились операционные расходы подразделения

 

Неизбежность изменений

 

В одном проекте по предотвращению брака на промышленном производстве мы работали с 1200 параметрами, из них более 800 существенно влияли на то, уйдет итоговое изделие в брак или нет. Это химические и массовые характеристики, температура, скорость элементов производственного процесса, показания приборов и настройки станков. Причем не было такого, чтобы 5–10 параметров влияли сильно, а остальные слабо. Понятно, что ни в одной человеческой голове увязать между собой сложно взаимозависимые 800 параметров в точную модель невозможно. Семидесятилетний мастер, основываясь на интуиции, меняет какие-то 3 настройки, и брак пропадает, но объяснить свое поведение он не может. Это пример обучения биологической нейросети в мозгу мастера в ходе многолетней практики. Но доверие такой нейросети и интуиции — не самое надежное основание для бизнеса. 

Кейс 2

Металлургический завод

Модель для предсказания и идентификации источника брака на линии

39%

брака

выявлено на этапе, когда его можно предотвратить

 

При этом число доступных данных во всех областях растет. На продажи пива в магазине влияют прогноз погоды, итоги вчерашнего матча, дизайн упаковки, выкладка на полке, расположение в торговом зале, час, день, курс доллара, тематика самых обсуждаемых топиков в соцсетях и 100 тысяч других параметров. Сейчас все эти данные оцифровываются и доступны для анализа. Тот, кто их анализирует, более экономически эффективен. Значит, анализировать их будут все, кто выживет в конкурентной борьбе. Человек становится все более неэффективным с ростом доступных для анализа данных и типов данных, даже человек, вооруженный самыми современными формулами и средствами визуализации. А значит, все, кто выживут, будут учить и использовать машину, пускать ее во все новые области традиционной человеческой деятельности.

Кейс 3

Сталелитейный завод 1 

Рекомендательная модель: в каких пропорциях смешивать кокс при его производстве.

98%

Точность модели 

+4%

Экономия угля 

 

Как попасть в завтра

 

При этом для конкретного бизнеса в движении к цифровому завтра всегда есть риск остаться только в мире научной фантастики и футурологов, хайпа и пресс-релизов. Взять исторические данные, провести с ними хакатон, выложить по его итогам фотки в инстаграм, а пресс-релиз на корпоративный сайт научились все. Довести проект до промышленной эксплуатации — уже не все. Провести комплексное изменение компании и выстроить конвейер перестройки бизнес-процессов с учетом открывшихся возможностей — единицы. А конвейер на самом деле — самое главное. Если менять по одному процессу в год, изменяться можно вечно. Особенно учитывая, что у взятого отдельного бизнес-процесса можно увеличить эффективность на считанные проценты. Мы, как мне кажется, за годы экспериментов на себе и сотрудничества с нашими партнерами попали в число этих единиц. 

Кейс 4

Сталелитейный завод 2

Модель, разработанная на основе исторических данных об изготовлении стали

3-5%

Экономия ферросплавов

 

Вызовы окружают нас со всех сторон. Технические вызовы: в онлайн-режиме не уронить производственную базу, откуда в модель валятся данные, все оттестировать, интеграция и изменения систем, с которыми интегрироваться. Проектные вызовы: на стыке желаемого и возможного сформулировать постановку задачи, определить критерии успеха, выстроить постоянное взаимодействие с бизнес-заказчиком в ежедневном формате. Организационные задачи: нужно выделить деньги на новое направление и не потратить их впустую, нужно подготовить инфраструктуру под новые возможности, нужно менять собственно организацию, и в рамках этого конвейера перестройки бизнес-процессов нужен кто-то, кто будет за это отвечать. Вещи, на первый взгляд, банальные, но сюрпризов в таком большом деле — масса.

 

Например, сейчас все говорят о важности постоянного контакта с бизнес-заказчиком. Мы сами сделали уже, наверное, сотни проектов в логике Agile, но, как оказалось, еженедельного контакта с бизнес-заказчиком для успеха катастрофически недостаточно. Практика нас научила, что во многих проектах специфика такова, что Data Scientist и бизнес-заказчик должны общаться ежедневно, работать вместе. Это важно для той же точной настройки модели, максимально корректной интерпретации ее результатов, особенно промежуточных неудач и аномалий, где нужна экспертиза в предмете, причем не общая, которую мы уже накопили в ряде отраслей, таких как ретейл, промышленность, банки и т.п., а конкретная, именно по данному бизнесу. На стартовых проектах мы уверенно планировали еженедельные встречи, так как их обычно хватает. А на многих проектах, даже когда заказчик и исполнитель работают в одной компании, так сейчас и происходит, и часто это приводит к конечному неуспеху.

 

Здесь должен бы следовать логичный вывод: лучшего партнера для построения конвейера изменений и движения по нему, чем мы, с конкретными успешными кейсами и решениями, опытом управления изменений, вам не найти. Но не знаю, не вырежет ли редактор такую саморекламу.

Кейс 5

Крупный ретейлер

Модель для предсказания поведения покупателей и формирования персональных товарных рекомендаций

33%

Точность рекомендаций

Кейс 6

Лизинговая компания

Анализ данных телематического оборудования. Определяем опасное вождение, разных водителей (нарушение договора лизинга), потенциальные угоны.

-11%

Снижение аварийности

Кейс 7

Логистическая компания

Оптимизация складских запасов. Анализ и предсказание спроса, что позволяет не хранить лишние товары на складе.

2,2-2,3%

Рост индекса оборачиваемости

Читайте также

ИИ-эволюция

Уведомления об обновлении тем – в вашей почте

Итак, у вас есть datascientist'ы и модели – что дальше

Самым часто употребляемым инструментом для подготовки моделей машинного обучения является Python, а точнее, ряд прикладных библиотек для него.

Спасибо!
Вы подписались на обновления наших статей
Предложить
авторский материал





    Спасибо!
    Вы подписались на обновления наших статей
    Подписаться
    на тему







      Спасибо!
      Вы подписались на обновления наших статей
      Оформить
      подписку на журнал







        Спасибо!
        Вы подписались на обновления наших статей
        Оформить
        подписку на новости







          Спасибо!
          Вы подписались на обновления наших статей
          Задать вопрос
          редактору








            Оставить заявку

            Мы всегда рады ответить на любые Ваши вопросы

            * Обязательные поля для заполнения

            Спасибо!

            Благодарим за обращение. Ваша заявка принята

            Наш специалист свяжется с Вами в течение рабочего дня