Yandex B2B Tech анонсировала единую платформу обработки больших данных для бизнеса

Yandex B2B Tech открыла бизнесу доступ к платформе собственной разработки для хранения и обработки больших данных YTsaurus. Об этом сообщает пресс-служба компании.

«С помощью платформы можно анализировать эксабайты данных в компаниях и обучать сложные модели машинного обучения с миллиардами параметров. YTsaurus доступна в двух форматах: в облаке и в инфраструктуре заказчика. В облаке решение доступно как управляемый сервис, поддержкой платформы будут полностью заниматься специалисты «Яндекса», — говорится в сообщении.

Платформу разрабатывали с 2010 года. Сейчас ее используют для хранения данных большинства сервисов, обучения YandexGPT и других нейросетей. Ранее платформа была доступна в опенсорсе.

«Платформа подходит для обработки небольшого количества данных и для работы с миллионом CPU и десятками тысяч GPU. Ее можно использовать как классическую MapReduce-систему, так и применять внутри платформы другие популярные решения для обработки данных», — отмечается в сообщении.

Разработка позволяет строить корпоративные хранилища данных, ETL-системы, обрабатывать как структурированные, так и неструктурированные или полуструктурированные данные, в том числе логи или финансовые транзакции.

«Для нас важно, чтобы у компаний были сервисы и инструменты для работы с данными под любой сценарий. Для этого мы, с одной стороны, создаем и развиваем сервисы для облачной платформы на базе открытых решений. С другой — тестируем и адаптируем для бизнеса собственные наработки, которые успешно применяются во внутренней инфраструктуре компании», — подытожил CTO платформы Yandex Cloud Иван Пузыревский.

промо изображение