La telefonía móvil: el reemplazo de las encuestas convencionales

Jessica Gamiño González*

Abril 12, 2018
No. 17/2018

Web-banner_boletin17

Ilustración: Joram Patiño, 2018

“Uno de los pros (de hacer encuestas a partir de telefonía móvil)
es que el tiempo de extracción es menor en relación a las encuestas convencionales”
--Christopher Chávez, 2017.

Basta una llamada telefónica desde su teléfono celular para tener una idea bastante aproximada de dónde se encuentra. Con el objetivo de facturar sus llamadas, la compañía telefónica registra una gran cantidad de datos e información, incluyendo la que registran las antenas de telefonía móvil, que pueden usarse como punto de referencia para establecer ubicación y trayectoria (si es que se está moviendo).

Regularmente, para obtener información sobre la movilidad de las personas en una ciudad, los investigadores y desarrolladores recurren a las encuestas origen-destino. Estas encuestas se utilizan para comprender mejor la dinámica de la movilidad en una zona geográfica en particular, lo que permite proponer mejoras para resolver problemas específicos en cuanto a construcción y aprovechamiento de la infraestructura de transportes y vialidades.

Sin embargo, una limitante de estas encuestas es el sesgo de la muestra. Por ejemplo, si la encuesta se realiza a casas habitación, la compilación de información dependerá de si las personas aceptan o no participar; si se realizan con una población específica (como los conductores del transporte público) los resultados sólo reflejarán la opinión de un grupo particular; o si se cuenta el número de vehículos que transita una avenida específica, la información obtenida sólo será válida para esa vía de comunicación. Otra limitante de las encuestas convencionales es económica pues es necesario emplear encuestadores.

Una alternativa para generar matrices de origen-destino de forma rápida y menos costosa son los dispositivos móviles. Este nuevo método representa una de las “mejores fuentes de datos” para la recopilación en grandes muestras poblacionales, dicho así por el ingeniero Miguel Picornell Tronch en su tesis doctoral presentada en la Universidad Politécnica de Valencia. Picornell Tronch asegura que “el uso generalizado de dispositivos móviles por parte de la población abre la posibilidad de recoger de manera anónima y pasiva una gran cantidad de información espacio-temporal de una gran muestra de usuarios”.

En ese sentido, una investigación publicada por el Massachusetts Institute of Technology (MIT) asegura que “en la última década, las tasas de penetración de teléfonos móviles ha aumentado tanto en países desarrollados como en desarrollo: la penetración actual es de 128% y 89% respectivamente”, lo cual es consecuencia de la creciente accesibilidad a las redes móviles.

A través de los dispositivos móviles no sólo es posible acceder a una muestra mucho mayor sino también a evaluar otro tipo de variables, como sitios de aglomeración o cuellos de botella. El registro de llamadas y mensajes emitidos por un teléfono celular se realiza a través de las antenas que el proveedor tiene distribuidas a lo largo y ancho de una ciudad, localidad o región.

Con el fin de investigar el potencial de la telefonía móvil para proporcionar información que permita analizar la movilidad, Christopher Chávez, ingeniero en computación por la UNAM y miembro del C3, elaboró una matriz origen-destino utilizando datos de telefonía móvil (compilados en 2013) de habitantes de Dakar, Senegal. Chávez presentó sus resultados en el Seminario de Movilidad del C3 el pasado mayo.

DATOS TELEFÓNICOS MEJOR QUE ENCUESTAS

Como parte de una iniciativa de bienestar social con fines académicos y sociales llamada Data for Development Senegal Challenge (D4D challenge), organizada por Orange Group a través de su compañía telefónica en España, Chávez tuvo acceso a metadatos –una base de datos sobre datos conocida como CDR (Call Detail Record, por sus siglas en inglés)– de usuarios de telefonía móvil de Dakar.

Un CDR provee información sobre las llamadas que se realizan con un proveedor de servicios telefónicos e indica cuándo (fecha y hora), dónde, duración (en minutos), quién llamó a quién y los costos (basados en una tasa por minutos). La compilación de estos metadatos se usa regularmente con el objetivo de elaborar los estados de cuenta de los usuarios. Los CDRs también pueden incluir metadatos de los mensajes por SMS.

En ningún caso los metadatos incluyen información sobre el contenido de los mensajes o llamadas ni sobre datos personales. Lo cual representa, hasta cierto punto, una de las áreas de oportunidad en análisis de este tipo, considerado así por Picornell Tronch, quien asegura que “las limitaciones vienen derivadas principalmente de las características espacio-temporales de los datos y de la falta de información socio-demográfica asociada a los mismos.”

El proyecto de Chávez ofrece un primer registro en materia de movilidad para Dakar pues la información que existe es casi nula, mencionó Chávez en entrevista. Además de que, gracias a los parámetros que considera, su algoritmo hace “consideraciones heurísticas (equivalentes a ensayo-error) específicas para Dakar” a partir de la información obtenida de censos sobre estilo de vida y movilidad.

En 2013, la población de Dakar era de 3 millones, con el 96% ubicado en zonas urbanas. La accesibilidad de transporte se estimó en 40 vehículos motorizados por cada mil habitantes (en la Ciudad de México hay 538), por lo que la mayoría de las personas se transporta a pie y los viajes más largos registrados tuvieron una duración de alrededor de 30 minutos. Un primer resultado del análisis de la matriz de Chávez es que los lugares de destino están cercanos a las viviendas de la mayoría de los habitantes.

APROVECHANDO LA TECNOLOGÍA

A partir de las antenas de recepción/transmisión telefónica se pueden identificar núcleos de señales telefónicas de redes 2G, 3G, e incluso 4G, que son rastreadas a partir de las conexiones que éstas crean en un rango de 0.5 kilómetros. Esto permite establecer redes que indiquen el avance de las personas, explicó el ingeniero durante el seminario.

Las redes de las antenas se establecen en la medida que un usuario efectúa una llamada o envía un mensaje, lo que significa que si no se encuentra usando la red móvil no puede emitir señales ni generar datos. De igual forma, señaló Chávez, existe un rango de “falsos desplazamientos”, donde una antena y otra interceptan la misma señal, dadas las condiciones del terreno y de la forma en que el usuario está posicionado. Para reducir este sesgo, algunos investigadores en el tema recomiendan establecer tiempos específicos de registro de señales.

Para analizar los núcleos de señales telefónicas, Chávez elaboró un algoritmo donde “el origen” es el primer dato con que se cuenta de un usuario y “destino” aquel en que una señal se detiene 20 minutos o más. El “destino” puede convertirse en un nuevo origen para el trayecto de regreso o en dirección a otro lugar. Los usuarios se identifican a partir de su identificador personal o ID y entre los datos que se pueden compilar están dónde inicia su viaje, dónde lo termina, y qué tiempo tardó en hacer ese recorrido.

Usando la información compilada en las diversas antenas es posible identificar los puntos en que se registra mayor actividad en la ciudad y, por lo tanto, los puntos donde existe mayor movilidad y los horarios de mayor conglomeración; también es posible ver el movimiento de personas y los sitios de mayor afluencia en los días festivos. Chávez destacó que, la matriz puede ajustarse a periodos de 24 horas lo que permite analizar la información por día.

Respecto de los parámetros considerados, Chávez utilizó los datos estadísticos de contexto existentes en el país para poder considerarlos al momento de realizar su matriz.

A FUTURO

A partir de el modelo desarrollado para elaborar matrices origen-destino, Chávez desea probarlo ahora en ciudades mucho más grandes y complejas que Dakar, como la Ciudad de México. A mediano plazo Chávez tiene como propósito obtener datos de telefonía móvil que permitan ampliar su estudio, de acuerdo a la demografía y movilidad propias de esta megalópolis.

La mayor ventaja de este tipo de encuesta origen-destino es la posibilidad de identificar áreas de conflicto en un menor tiempo, a menor costo y con mayor precisión que las encuestas tradicionales. También existen áreas de oportunidad en cuanto a la comparación de datos.

*Becaria del Programa UNAM-DGAPA-PAPIME PE308217

Descargar el pdf