Дэвид Синглтон (David Singleton), вице-президент по разработке Google, рассказал на фестивале "Каннские львы – 2017" о последних разработках в области машинного обучения.

Машинное обучение – часть современных технологий, которые помогают нам искать решения самых разных задач, от борьбы с изменением климата до развития образования. Компания Google не первый год разрабатывает технологии машинного обучения, и на сегодняшний день они широко используются в большинстве наших продуктов. В частности, с их помощью мы полностью изменили YouTube и Google Переводчик, а также создали новые сервисы, такие как Google Ассистент. Другие компании, принадлежащие группе Alphabet, в свою очередь опираются на возможности машинного обучения и искусственного интеллекта (ИИ), чтобы разрабатывать революционные методы диагностики рака, бороться с проявлениями ненависти и грубыми комментариями в Интернете или оптимизировать потребление энергии.

Сначала давайте вспомним историю. В последнее время машинное обучение и ИИ приобрели большую популярность, однако это далеко не новые технологии. В 1990-е годы в Кембридже у меня уже был курс нейрокомпьютерной техники, но сама область исследований старше ещё на несколько десятилетий. Первые статистические модели, отражающие работу человеческого мозга, появились в 1950-е. Конечно, ранние модели были слишком упрощенными. Только в последние годы машинное обучение из набора интересных теорий и алгоритмов превратилось в практическое направление деятельности. Это стало возможным благодаря развитию нейронных сетей и облачных технологий, а также появлению огромных баз данных.

По своей сути машинное обучение – это метод решения проблем. На заре развития компьютеров программы представляли собой наборы правил обработки данных: как получить нужный результат на основе введенной информации. Однако подобные системы с трудом справляются с решением реальных задач. В окружающем мире редко встречаются четкие упорядоченные структуры. В машинном обучении используется противоположный подход: алгоритм "учат" выявлять структуры и подобия в больших наборах данных, а затем на их основе составлять собственные правила. На практике такие технологии могут быть задействованы в самых разных целях, от выбора только фотографий кошек и собак из галереи в вашем смартфоне до оптимизации охлаждения в центре обработки данных.

Технологии машинного обучения и ИИ умеют решать проблемы, с которыми не способен справиться один человек или даже группа людей. Возможности и масштабы применения этих технологий порой пугают, но на самом деле это обычные инструменты, позволяющие находить ответы на важные и сложные вопросы. Используя машинное обучение и ИИ в дополнение к нашим собственным творческим способностям, мы можем заглянуть в будущее и многого добиться.

Несколько команд Google изучают возможности машинного обучения применительно к рисованию, искусству и музыке, а самый наглядный пример наших достижений – Google Ассистент. Это искусственный интеллект, связывающий несколько устройств, и личный помощник каждого пользователя. Он изучает ваши данные и интересы (например, за какую команду вы болеете) и по запросу предоставляет вам необходимую информацию. Благодаря технологиям машинного обучения и обработки естественного языка с Ассистентом можно разговаривать как с живым человеком. Многим это нравится: по нашим данным, 70% устных запросов представляют собой обычные фразы, а не наборы ключевых слов.

Google Ассистент уже сейчас доступен более чем на 100 миллионах устройств, включая смартфоны на Android, а также Google Home, iPhone и Android Wear. Вскоре к ним добавятся и другие, например автомобили и Smart TV. Google Ассистент – не просто инструмент поиска. Для него создаются новые приложения и функции, а в развитии этой платформы участвуют такие известные компании, как Spotify, Netflix и eBay. Многие бренды хотели бы обращаться к своим покупателям напрямую, и благодаря Google Ассистенту, машинному обучению и ИИ на это можно рассчитывать.

Машинное обучение активно используют и некоторые другие компании, входящие в состав группы Alphabet. Например, эксперты по правилам, инженеры, исследователи и специалисты по ИИ из компании Jigsaw изучают способы применения этой технологии в целях повышения безопасности на международном уровне. Компания ставит перед собой ряд непростых задач: решить проблему радикализации в Интернете, остановить распространение фальшивых новостей и угрозу онлайн-цензуры. Первый продукт Jigsaw, Perspective, предназначен для борьбы с оскорблениями и выражением ненависти в комментариях.

Почти каждый бывал свидетелем преследований и издевательств в Интернете, и практически каждый второй пользователь сам оказывался жертвой подобных действий. Анализируя базы данных партнеров, таких как "Нью-Йорк Таймс", алгоритмы машинного обучения Perspective научились определять проявления ненависти, которые отталкивают людей от участия в разговорах. Perspective API оценивает "степень токсичности" каждого комментария, что дает издателям надежные масштабируемые критерии для оценки и фильтрации записей. Это помогает поддерживать атмосферу вежливости и привлекать в беседу больше участников. Внедрив Perspective, онлайн-издание "Нью-Йорк Таймс" открыло значительную часть популярных статей для комментирования. Ранее, согласно политике сайта, оставлять отзывы можно было примерно на 10% статей, но сейчас издатели планируют постепенно открыть для комментирования все свои материалы.

Поскольку мы заинтересованы в развитии отрасли в целом, некоторые основные компоненты наших технологий машинного обучения доступны для компаний и исследователей, не входящих в группу Alphabet. Например, мы предлагаем Google CloudML – набор общедоступных API, позволяющих использовать простые технологии машинного обучения в Google Cloud. Также у нас есть открытая библиотека TensorFlow. Она может применяться в независимых проектах и доступна как для организаций и компаний, так и для самостоятельных разработчиков.

Благодаря этим инструментам ряд крупных и мелких компаний уже экономит ресурсы на выполнении трудоемких задач. TensorFlow и CloudML взяли на себя управление рядом сложных процессов, от автоматической сортировки огурцов на фермах в Японии до удаления облаков со спутниковых снимков компании Airbus Defence and Space. Сотрудники, которые раньше этим занимались, теперь могут сосредоточиться на том, что требует творческих способностей и воображения.

У технологий машинного обучения огромные перспективы. Тысячи блестящих специалистов со всего мира сейчас работают над важнейшими задачами: изменением климата, исследованием космоса, развитием образования. С помощью инновационных инструментов они смогут найти решения, которые сделают наш мир лучше.