Машинное обучение (МО) — подобласть компьютерной науки, которая занимается такими задачами, как распознавание лиц, распознавание речи, обработка естественного языка, прогнозный анализ, глубокое обучение (глубокие нейронные сети) и многие другие. Для решения таких задач применяются различные инструменты. Так как существует много инструментов машинного обучения стоит их разделить на платформы и библиотеки. Платформа предоставляет все, что нужно для запуска проекта, в то время как библиотека предоставляет только дискретные возможности. В нынешний день существуют различные инструменты и платформы для решения задач машинного обучения. Онлайн-платформы могут предоставить все те возможности, которые доступны в инструментах машинного обучения и даже больше, так как разработчиками таких платформ являются лучшие специалисты в этой сфере. Такие платформы предоставляют возможности для завершения проекта машинного обучения от начала до конца. А именно, анализ данных, подготовка данных, моделирование, оценка и выбор алгоритма.
Целью данной статьи является рассмотрение некоторых онлайн платформ машинного обучения и ознакомление с возможностями этих платформ.
Algorithmia [1] предоставляет платформу на основе облака для разработчиков алгоритмов, чтобы поделиться своей работой, а также для разработчиков приложений, включающих алгоритмы в свои приложения. Сотни алгоритмов уже доступны для решения большинства возможных задач, в том числе для анализа текстов, компьютерное зрение, графики, машинного обучения и другие. Расчет стоимости основан на частоте использования алгоритма и времени использования.
Amazon Machine Learning [2] – это сервис, который предоставляет возможности для разработчиков всех уровней квалификации используя технологию машинного обучения. Amazon Machine Learning предоставляет инструменты визуализации и мастеров, которые ведут вас через процесс создания модели машинного обучения без необходимости изучения сложных алгоритмов и технологийМО. После того, как модели будут готовы, Amazon Machine Learning позволяет легко получить предсказания для приложения, используя простые API-интерфейсы, без необходимости реализации пользовательского кода.
BigML [3] – это платформа машинного обучения на основе облака с простым в использовании графическим интерфейсом. Она также предоставляет простые механизмы для включения прогнозирующих моделей в приложениях через REST API. Платформа включает в себя наблюдаемое обучение (для построения прогнозных моделей), обучения без учителя (для понимания поведения), обнаружения аномалий (используется в выявлении случаев мошенничества), средства визуализации данных (разброс-диаграмм и графиков Sunburst) и множество механизмов для изучения данных. Скромное ценообразование делает её привлекательным для среднего и крупного бизнеса, которые хотят преимущества в работе с машинным обучением без больших предварительных затрат и задержек в реализации. BigML является прагматичной, с низкой стоимостью, простой в использовании платформой для построения мощных прогностических моделей.
DataRobot [4] – это сервис машинного обучения на основе облачных вычислений, который выполняет большую часть мелких работ в процессе построения прогнозной модели. Он автоматически ищет лучшие признаки, выбирает наиболее подходящие алгоритмы, тестирует модели и предоставляет API для развертывания модели. Он берет лучшие алгоритмы из R, Python, Spark, и из других источников, и использует TextMining, обнаружение типа переменной, кодирование, масштабирование, преобразование и автоматическая генерация признаков. Инфраструктура в широком масштабе мощный для быстрой обработки, и большие данные хорошо поддерживается с сертификатом на ClouderaEnterprise 5.
FICO [5], возможно, имеет самый большой опыт любого поставщика в применении статистических и технологий машинного обучения для бизнес-задач. Аналитическое Облако FICO охватывает задачи машинного обучения, статистики, оптимизации и бизнес-правил управления, в контексте хорошо управляемой среде. Он также служит в качестве рынка для разработчиков аналитических решений и пользователей, которые имеют потребность в них.
Google Prediction API [6] можетинтегрироватьсяс App Engine, и RESTful. API доступна через библиотеки для многих популярных языков, таких как Python, JavaScript и.NET. Prediction API обеспечивает возможности поиска по шаблону, сентиментальный анализ клиентов, анализ оттока, обнаружения спама, классификации документов, прогнозирование покупки, рекомендации, интеллектуальная маршрутизация и многое другое. Он считывает данные из BigQuery и Google Cloud Storage.
HPE Haven OnDemand [7] обеспечивает более 60 API-интерфейсов и услуг, которые обеспечивают аналитику на основе глубокого обучения для широкого спектра данных, включая текст, аудио, изображения, социальной сети и видео.
Платформа WatsonAnalytics [8] компании IBM предлагает возможности прогнозного анализа и визуализации данных, и диалоговый тип интерфейса. Она автоматически делает сложную математику, чтобы показать наиболее значимые факты, закономерности и отношения. Бесплатная версия предлагается с ограничениями на объемы данных.
Платформа PurePredictive [9] использует искусственный интеллект для автоматизации процесса машинного обучения. Платформа позволяет автоматизировать обнаружение преобразований данных и более высоких отношений порядка между признаками данных и автоматически приспосабливает искажение данных. Облачная платформа масштабируется автоматически для рабочих нагрузок, что позволяет размещать наборы данных практически любого размера. Модели легко расширяются через веб-сервисы, и могут поддерживаться автоматически, чтобы справиться с изменениями в условиях ведения бизнеса.
Yottamine [10] включает в себя широкие возможности для импорта и применения моделей в реальных условиях. Он разработан, чтобы позволить пользователям в полной мере воспользоваться возможностями масштабируемых по требованию облачных систем вычисления, а также устранить высокую стоимость выделенной инфраструктуры. Прогнозная служба Yottamine позволяет строить модели или делать предсказания в два простых шага. С помощью интеграции с масштабируемыми облачными системами вычисления обеспечивает высокую скорость и эффективность. Он также соответствует стандарту безопасности SSL и может экспортировать в PMML те модели, которые поддерживаются стандартом. Пользователи могут подключаться и управлять Yottamine Predictive Web Services с использованием языка программирования R с помощью пакета YottamineR.
Algorithms.io [11] обеспечивают размещенную в облаке службу для сбора данных, создания моделей классификации и оценки новых данных. Специальный программный код добавляется веб и мобильным приложениям, которые посылают потоки данных в службу algorithms.io, где они фиксируется и обрабатывается с помощью алгоритмов случайного леса, опорных векторов, K-Means, дерево решений, логистической регрессии и алгоритмов нейронной сети. Полученная модель используется для классификации новых данных. Результаты передаются обратно в качестве анализируемой потока данных в виде отчетов и визуализаций. Набор интерфейсов API предназначены для разработчиков для интеграции машинного обучения в веб и мобильные приложения. Алгоритмы категорированы как обнаружение аномалий, кластеризация, классификации и коллаборативная фильтрация.
Литература:
- https://algorithmia.com/
- http://aws.amazon.com/machine-learning/
- https://bigml.com/
- https://www.datarobot.com/
- http://www.ficoanalyticcloud.com/
- https://cloud.google.com/prediction/
- https://www.havenondemand.com/
- http://www.ibm.com/analytics/watson-analytics/
- http://www.purepredictive.com/
- https://yottamine.com/yottamine-predictive-web-service
- http://www.algorithms.io/