Cabify usa BigQuery para compartir trayectos

Cabify implementa Google Cloud Platform en su flujo de procesamiento de datos a través de la herramienta Google BigQuery, lo que permite a sus científicos de datos disponer de información más actualizada y reducir la carga operativa gracias a sus servicios gestionados.

En todo el mundo, la economía colaborativa se encuentra cimentada en la confianza; sin embargo, la forma en que las personas deciden en quién pueden confiar varía de un país a otro. La empresa española Cabify ha sabido adaptar el modelo de las aplicaciones de transporte concertado a las particularidades de Latinoamérica, y se ha centrado tanto en la seguridad de los clientes como en el bienestar de sus conductores. Gracias a estas estrategias, la empresa ha crecido a pasos agigantados en la última década y, en la actualidad, opera en 11 países de Europa y Latinoamérica. En palabras de Sebastián Barrios, director y vicepresidente de Tecnología de Cabify: "Se trata de un sector que avanza a una velocidad de vértigo, en el que no paran de surgir nuevos servicios, regulaciones y competencia".

"Nuestra estrategia consiste en externalizar toda la carga operativa posible, de modo que solo tengamos que ocuparnos de una pequeña parte. Así, podemos centrarnos en desarrollar nuestro negocio para alcanzar nuestras metas a largo plazo; por ejemplo, diversificar nuestros servicios para dar respuesta a todas las necesidades de movilidad".

Sebastián Barrios, director y vicepresidente de Tecnología de Cabify

Con Cabify, los usuarios reservan los viajes a través de una aplicación en su smartphone. La empresa ofrece sus servicios en más de 40 ciudades, lo cual implica que decenas de miles de conductores informan de su ubicación cada cuatro o cinco segundos. Sobre esta cuestión, Sebastián afirma lo siguiente: "Nos enfrentamos a situaciones reales en las que cualquier periodo inactivo se traduce en clientes perdidos y, por tanto, en menos dinero en los bolsillos de nuestros conductores. No es una responsabilidad que deba tomarse a la ligera".

Los servicios de Cabify funcionan en un entorno multinube, y la empresa quería mejorar el rendimiento del procesamiento de datos y desarrollar su infraestructura de ciencia de datos. Se decidieron por Google Cloud Platform (GCP) porque era el servicio que mejor se adaptaba a sus necesidades.

Crear un nuevo flujo de procesamiento de datos

Cuando se compite en un mercado de naturaleza dinámica, es esencial extraer rápidamente información valiosa acerca de las funciones para mantenerse a la cabeza de la competencia. En este contexto, Cabify quería mejorar el rendimiento de su infraestructura de datos para disfrutar de una mayor agilidad y fiabilidad. Según explica Sebastián: "En cuestión de segundos, debemos calcular la ruta más rápida entre varios puntos, teniendo en cuenta el tráfico que haya en ese momento y las peticiones y necesidades del usuario", a lo que añade: "La naturaleza inestable de las redes móviles complica aún más esta tarea, así que era fundamental optimizar nuestros entornos de procesamiento de datos".

Para conseguir todo esto, en el 2018 Cabify migró su infraestructura de procesamiento de datos a GCP e integró nuevas herramientas de ciencia de datos con el flujo de procesamiento correspondiente de GCP. Sobre esta cuestión, Sebastián comenta: "Todas nuestras aplicaciones, independientemente del proveedor de servicios en la nube donde estén alojadas, derivan la información a GCP a través de Cloud Pub/Sub. Este servicio es fantástico porque se escala y responde de manera automática. Ahora mismo, estamos adoptando una arquitectura de microservicios y, gracias a Cloud Pub/Sub, hemos conseguido que nuestra infraestructura esté basada en eventos. Esto reduce acoplamiento, potencia la resiliencia y permite que nuestros equipos desempeñen sus funciones de forma más rápida".

Los datos recogidos proceden de diversas fuentes, como los propios coches de los conductores y los escúteres. Más tarde, estos se transfieren a Cloud Storage o Cloud SQL, o bien se retienen en Cloud Bigtable si necesitan procesarse más antes de introducirse en BigQuery. Sobre este asunto, Sebastián afirma: "Con BigQuery, podemos controlar los costes, ya que solo se nos facturan las consultas que ejecutamos y los datos que usamos. Además, ofrece un rendimiento de primera categoría: estas consultas se ejecutan en un abrir y cerrar de ojos, independientemente de si tenemos que procesar megabytes o terabytes de datos".

Automatizar y optimizar tareas que no son esenciales

Cabify también utiliza otras herramientas de GCP para automatizar y optimizar los procesos internos. "Utilizamos la API Cloud Vision para procesar automáticamente distintos documentos de clientes y conductores que se digitalizan en el sistema", cuenta Sebastián. "Además, usamos App Engine y Cloud Functions para nuestra plataforma por voz, en la que los usuarios pueden solicitar un servicio a través de un asistente de voz, así como para los bots de nuestra plataforma interna. También empleamos Firebase Cloud Messaging para las notificaciones push que avisan a los usuarios cuando el coche que han solicitado está a punto de llegar".

Además, Sebastián añade: "Es estupendo poder delegar estas tareas y hacerlo de manera rentable, ya que nos permite centrarnos en desarrollar las soluciones clave que aportan valor a nuestra empresa".

Fomentar el crecimiento empresarial rentable

Tras implementar su nueva infraestructura de datos en GCP, Cabify ha conseguido mejorar el tiempo de respuesta de los datos. Según Sebastián: "Gracias a BigQuery, podemos trabajar con datos prácticamente en tiempo real. Antes, recibíamos la información que utilizábamos con 24 horas de retraso, mientras que ahora disponemos de ella solo un par de minutos después de que se genere. Esto se lo pone fácil a nuestro equipo de científicos de datos a la hora de adoptar un enfoque basado en indicadores clave de rendimiento. Ahora podemos definir parámetros y supervisar de forma mucho más precisa cómo influyen en el rendimiento".

Por otro lado, la empresa también ha podido observar cómo las consultas se ejecutan mucho más rápido; ahora, las que antes tardaban minutos o incluso horas se completan en cuestión de segundos. Gracias a esto, ha aumentado la agilidad de sus equipos de científicos de datos. Por si esto fuera poco, GCP también ha resultado ser la solución ideal desde el punto de vista financiero. En palabras del propio Sebastián: "Contar con mecanismos de control de costes es fundamental para nosotros, ya que una de las cosas que más nos diferencia del resto es que desarrollamos nuestro negocio de forma rentable. La filosofía de GCP de pagar solo por lo que se usa nos parece fantástica".

Ahora, Cabify planea migrar el resto de su infraestructura base a GCP. "Ya hemos trasladado nuestros entornos de pruebas y desarrollo a Compute Engine, y tenemos pensado hacer lo mismo con gran parte de nuestra infraestructura el año que viene. Como resultado, prevemos un ahorro global de aproximadamente el 30 %", afirma Sebastián.

Finalmente, Sebastián añade: "Nos hemos propuesto diversificar nuestros servicios para que den respuesta a las necesidades de movilidad de todos nuestros clientes y seguir aumentando nuestro volumen de negocio de forma rentable. Se trata de un reto muy emocionante y, gracias a GCP, podemos centrarnos en el desarrollo sin preocuparnos por las tareas operativas".

Mutua Madrileña y su uso de Google Cloud