Compártelo:

Después del anterior post, donde expliqué que es el Big Data, recibí varios mensajes sobre lo difícil que es conseguir datos o sobre los datos que podía tener una empresa, y que estos no le pudieran servir de nada para poder mejorar, o que, si no era una empresa no disponía de datos al igual que un nuevo negocio, porque sus competidores potenciales, no le darían esa información.

Y mi respuesta para ellos es:

DATOS ABIERTOS / OPEN DATA

El Open Data (datos abiertos) es un término que se refiere a la disponibilidad de datos de forma pública y accesible, permitiendo que cualquiera pueda utilizarlos, compartirlos y distribuirlos libremente. En este artículo, explicaremos qué es el Open Data, cuáles son sus beneficios y cómo acceder a datos abiertos para su uso en proyectos de investigación, desarrollo de aplicaciones, y mucho más.

¿Qué es el Open Data?

El Open Data es una filosofía que promueve la transparencia, la colaboración y la participación ciudadana. Consiste en hacer disponibles los datos de instituciones públicas, empresas y organizaciones de la sociedad civil, con el fin de que cualquier persona pueda acceder, utilizar y compartir esa información libremente.

El Open Data puede incluir información en diferentes formatos, como texto, imágenes, audio, vídeo y datos estadísticos. Estos datos pueden utilizarse para investigaciones académicas, para el desarrollo de aplicaciones y herramientas, para mejorar la toma de decisiones públicas y para el análisis y visualización de datos.

Beneficios del Open Data:

La disponibilidad de datos abiertos tiene muchos beneficios para la sociedad, como:

  • Mejora la transparencia y la rendición de cuentas de las instituciones públicas y empresas.
  • Fomenta la innovación y el desarrollo de nuevas aplicaciones y servicios.
  • Permite una mejor toma de decisiones por parte de la sociedad civil y de los gobiernos.
  • Facilita el monitoreo y evaluación de políticas públicas y programas sociales.
  • Promueve la participación ciudadana y la colaboración entre diferentes sectores de la sociedad.

Tabla de contenido

Ejemplo de open data Valencia

Para responder y explicar mejor esto, me viene fantástico una tarea que realicé para el master, “Distribución de las estaciones de Valenbisi” donde explicaba cómo tras realizar una pequeña búsqueda en la red sobre “Datos abiertos Valencia”, encontré la web sobre open data del ayuntamiento de Valencia (http://gobiernoabierto.valencia.es), para poder así alejarme un poco del tema deportivo y del fútbol, sobre el que tantos compañeros estaban escribiendo la tarea.

Puede que te preguntes porque me decidí por tratar datos sobre una ciudad, pero es qué resulta que:

España es un referente europeo en apertura de datos, pero la falta de una estrategia de estandarización a nivel local y regional dificulta el tratamiento de la información.

Lista de los ayuntamientos españoles con mejores puntuaciones en el Ránking de ‘open data’ que ha elaborado 8wires. 8wires

De ese modo que pensé ¿Porque no aprovecharlo?

Así que me decidí por Valencia y puse a revisar un poco las diferentes informaciones que disponían en la web y me llamó la atención su mapa sobre la distribución de las 276 estaciones que hay de Valenbisi, porque además de poder interactuar con los datos a través del mapa, ponen a disponibilidad publica dicha información en un archivo en formato .csv.

(Para quienes no conozcan de que se trata Valenbisi, es un servicio público en el que puedes “alquilar” una bicicleta para poder moverte por la ciudad, siempre cogiéndola y dejándola en las diferentes estaciones/parkings que tiene la ciudad)

Pero en este documento, además de decirnos la ubicación geográfica de la estación, como podemos ver en el mapa, podemos ver:

  • Name: El nombre de la estación.
  • Number: Número de la estación.
  • Open: Si está operativa o no.
  • Available: La cantidad de bicicletas disponibles.
  • Free: Cantidad se sitios libres para estacionar bicicletas.
  • Total: Número total de sitios para estacionar bicicletas.
  • Ticket: Si se puede pagar con tarjeta o no.
  • updated_at: Data de la última actualización de los datos.

Esta última columna “updated_at”, después de haber entrado varias veces a consultarla, y ver que era instantánea la información de la hora y día, eso demuestra el perfecto nivel de comunicación e informatización ya que llevan a cabo actualizaciones constantes de los datos, permitiéndoles ofrecer un mejor servicio.

Si acercamos el mapa, podemos analizar las diferentes zonas donde se encuentran las estaciones de Valenbisi, y como podemos observar en las siguientes dos imágenes, tienen el parking urbano de la ciudad, repartido por toda la ciudad, respaldando lo que comentaba unas líneas más arriba sobre el gran servicio que ofrecen.

Tras acercar el mapa algo más, vemos que en lo que consideraríamos el centro de la ciudad, hay más de 40 estaciones, al igual que ocurre en la zona de las universidades y del Mestalla (Campo del Valencia), que cada centenar de metros podemos encontrar una estación donde coger o depositar una bicicleta. Incluso podemos encontrar una estación en las puertas del Estadio Ciudad de Valencia (Campo del Levante), a pesar de encontrarse prácticamente en la parte más alejada del núcleo urbano.

Por último, observamos que en las primeras líneas de la playa hay 15 diferentes paradas, lo cual respalda la idea que comentaba sobre como el ayuntamiento ha intentado promover al máximo la movilidad mediante este transporte.

Si ahora pasásemos a ver la posible usabilidad de los datos, esta dependería de quien sea el que los vaya a analizarlos, por ejemplo:

Posibles usos del Open data

  • Las universidades podrían estudiar el tránsito de estudiantes que utilizan este medio de transporte.
  • El ayuntamiento podría:
    • Detectar las zonas de mayor tránsito y de interés.
    • Averiguar en qué sitios interesaría poner una mayor flota de bicicletas.
    • Encontrar lugares donde instalar nuevas estaciones de Valenbisi
    • Descubrir las rutas que realizan los turistas la visitar la ciudad, y posteriormente optimizarlo para que visiten lugares de mayor interés o que puedan visitar más sitios en menos tiempo.
  • La empresa de mantenimiento podría por ejemplo adelantarse a las averías cíclicas.

Páginas públicas con datos abiertos / open data

Llegados a este punto, puede que digas vale vale muy interesante eso que me cuentas, pero no quiero ver solo datos de Valencia o quiero conocer otras páginas donde verlos, así que no te preocupes, voy a mostrarte algunas páginas donde encontrar más datos abiertos libremente.

Soy consciente que existen muchas poblaciones, provincias, comunidades y órganos que tienen webs con datos abiertos, pero solo he puesto unos pocos, no obstante, no dudes en preguntar si quieres conocer la existencia de alguna que no esté aquí.

  • Portal de Datos Abiertos de Esri España: https://opendata.esri.es/En esta web, ponen a disposición del usuario una gran variedad de contenidos abiertos, para que se puedan consultar, analizar, descargar, además de generar aplicaciones y servicios con ellos, pero no solo de España, sino que hay muchos que tratan de Europa.

Pero no solamente en España se pueden encontrar datos abiertos, saliendo de las fronteras de España, con una pequeña búsqueda podemos encontrar algunos ejemplos de datos abiertos como serían;

  • Datos abiertos Europa: https://ec.europa.eu/eurostat Es una gran página web donde aglutinan una enorme cantidad de datos, muy bien categorizada, para que se pueda acceder a ella fácilmente.
  • Datos abiertos Gobierno de Argentina: https://datos.gob.ar/Ponen al alcance datos públicos en formatos abiertos de Argentina, para que puedan usarlos, modificarlos y compartirlos los usuarios.
    • Datos abiertos Provincia de Buenos Aires: https://catalogo.datos.gba.gob.ar/ En la web nos permiten acceder a datos abiertos de los diferentes ministerios y de los poderes entre otros apartados.
  • Datos abiertos Gobierno de Chile: https://es.datachile.io/ Ponen al alcance de todos los usuarios datos públicos Open data de Chile, para que puedan usarlos, modificarlos y compartirlos los usuarios, pero todo no queda ahí, ya que pese a estar aún en proceso de construcción algunas secciones de la web, es una página muy completa y con una gran cantidad de información, desde datos centralizados de las diferentes poblaciones del país, hasta los productos que exportan que importan o incluso las relaciones con otros países tanto comerciales, como turísticos o de inmigración.
  • Datos abiertos del ayuntamiento de Seattle: https://data.seattle.gov/ Para que observemos que muchas ciudades ya recopilan y ponen a la mano del publico datos.
  • Open data Kaggle: https://www.kaggle.com/datasets Es una plataforma, gratuita, en forma de comunidad que contiene diferentes recursos, entre ellos conjuntos de datos, competiciones, archivos con los que practicar y desarrollar con conjuntos de datos proyectos de machine learning (Aprendizaje automático).

Open data en el deporte

Puede que digas guay, hay muchos datos abiertos de países, ciudades, empresas… pero lo que yo quiero son datos abiertos de deporte. No te preocupes que aquí también hay una pequeña recolección de páginas web con open data deportivo, aunque la mayoría de ellas serán de fútbol, al ser la temática que más compañeros han escogido tratar.

Pero si hay que hablar de datos abiertos en el deporte, se hablará muy probablemente de https://www.sports-reference.com/ o alguna de las páginas que forman su grupo en beisbol, baloncesto, fútbol americano, hockey y fútbol.

Open data en Fútbol

Si tenemos que hablar sobre páginas de datos abiertos de fútbol, hay que citar sí o sí https://fbref.com/ es una página de referencia sobre el tema, que se encuentra dentro del grupo de páginas que hemos hablado previamente.

En esta página encontraremos una gran cantidad de datos estadísticos futbolísticos, tanto a nivel de competición, como del equipo o selección como del propio jugador o jugadora, y todo esto no solo de esta temporada, sino de toda su historia como deportista profesional de primer nivel.

En cuanto a datos masculinos, tienen datos de las ligas europeas, de todo el continente americano tanto de Suramérica como Norteamérica y Centroamérica, australianas y las principales ligas asiáticas, es decir prácticamente todas las ligas de primer nivel del mundo, además de las copas nacionales de las 5 grandes ligas europeas y la estadounidense y las copas internacionales además de las competiciones de selecciones.

El nivel de datos disponibles del fútbol femenino es muy inferior, aunque mayor del esperado, ya que disponen de datos de nueve ligas, además de la Champions y de todas las competiciones a nivel selecciones que hay en el mundo.

Además de datos de todos los jugadores y jugadoras de los equipos y selecciones que participan en dichas competiciones, según indican tienen en su base de datos más de 166000 jugadores.

Esta página, junto a https://www.transfermarkt.es hacen la dupla de páginas que todo scouter u ojeador, debe tener controladas y al día, porque esta última muestra cómo va variando el valor de cada jugador, pero aunque esta sea su principal función o por la que más personas la reconocen, tiene grandes funciones como conocer los jugadores que se encuentran sin equipo o los que están a punto de acabar su contrato.

Otra gran página de datos estadísticos para tener en cuenta, es https://es.whoscored.com y en esta página web, parece que puedes observar datos además de las ligas disponibles en la primera página, también tienen datos de las ligas africanas, pero en contraparte no tienen datos del fútbol femenino. Otra base de datos “abierta” podría ser la usada por los juegos Football Manager, al disponer de datos de la gran mayoría de las ligas del mundo al menos de los dos primeros niveles de cada país, aunque este es un tema de debate muchas veces, por tratarse de datos subjetivos de los ojeadores que visualizan a los jugadores, pero para hacer un primer corte o búsqueda de jugadores serviría, además de tener un bajo coste.

Otra base de datos “abierta” podría ser la usada por los juegos Football Manager, al disponer de datos de la gran mayoría de las ligas del mundo al menos de los dos primeros niveles de cada país, aunque este es un tema de debate muchas veces, por tratarse de datos subjetivos de los ojeadores que visualizan a los jugadores, pero para hacer un primer corte o búsqueda de jugadores serviría, además de tener un bajo coste.

Pero si lo que buscamos son datos históricos, http://www.linguasport.com es una de nuestras páginas, si buscamos centrarnos en las competiciones españolas, ya que podemos encontrar datos desde la primera temporada en la que se disputaron la liga, la copa del rey y de la supercopa, todo ello bien dividido por temporada, además de ofrecernos datos de competiciones internacionales, como el mundial y los juegos olímpicos.

Otra página donde consultar seria https://www.football-data.co.uk/data.php, esta web está especializada y focalizada en las apuestas, pero el apartado del que hemos puesto el enlace tienen un gran repositorio de los datos históricos de las principales ligas a nivel mundial como los resultados, los partidos, los goles…, por ejemplo de la primera división española tiene todos estos datos desde la temporada 1993-1994, además de en algunos casos como la liga inglesa tienen hasta datos de la tercera división.

Open data en Tenis

Si tenemos que hablar sobre páginas de datos abiertos de fútbol, hay que citar sí o sí https://fbref.com/ es una página de referencia sobre el tema, que se encuentra dentro del grupo de páginas que hemos hablado previamente.

Si lo que buscamos son datos históricos de tenis, nuestra página es http://www.tennis-data.co.uk/alldata.php, al igual que la anterior página open data de fútbol que hemos hablado, esta web está especializada y focalizada en las apuestas, pero el apartado del que hemos puesto el enlace tienen un gran repositorio de los datos históricos de los principales torneos masculinos ATP desde el año 2000 y de los datos de los torneos femeninos WTA desde el año 2007.

Open data en Fútbol americano

La principal página de datos abiertos de fútbol americano, es https://www.pro-football-reference.com  ya que es una página de referencia sobre el tema, que se encuentra dentro del grupo de páginas que hemos hablado previamente.

En esta web encontraremos todos los datos que queramos conocer sobre la NFL, tanto de los jugadores como de los equipos, incluso dividido y bien organizado según las conferencias a la que pertenecen los equipos, pero no queda ahí porque además de todo esto tienes los datos de los drafts de cada año, todo ello con un amplio histórico de temporadas.

Además, entre este grupo de páginas podemos encontrar https://www.sports-reference.com/cfb donde están los datos de la liga universitaria, ofreciéndonos los datos igual que hacen la página de datos de la NFL.

Open data en Baloncesto

La que pondríamos como página de referencia sobre el tema, es https://www.basketball-reference.com, que también se encuentra dentro del grupo de páginas que hemos hablado previamente.

En esta web encontraremos todos los datos abiertos que queramos conocer sobre la NBA, tanto de los jugadores como de los equipos, incluso dividido y bien organizado según las conferencias a la que pertenecen los equipos, pero no queda ahí porque además de todo esto tienes los datos de los drafts de cada año, todo ello con un amplio histórico de temporadas.

Además, entre este grupo de páginas podemos encontrar https://www.sports-reference.com/cbb donde están los datos de la liga universitaria, ofreciéndonos los datos igual que hacen la página de datos de la NBA.

No obstante, si lo que buscamos son datos de la liga ACB, http://www.linguasport.com es una de nuestras páginas, si buscamos centrarnos en las competiciones españolas, ya que podemos encontrar datos desde la primera temporada en la que se disputaron la liga, la copa del rey y de la supercopa, todo ello bien dividido por temporada, además de ofrecernos datos de competiciones internacionales, como el mundial y los juegos olímpicos. Otra página donde consultar seria http://www.bdbasket.com donde encontraremos el histórico de las temporadas de la liga ACB desde el año 1990, pero no solo eso, sino que encima podemos obtener los datos ordenados tanto por equipos, como por jugadores e incluso por entrenadores.

Open data en Hockey

La principal página de datos abiertos de fútbol americano, es https://www.hockey-reference.com ya que es una página de referencia sobre el tema, que se encuentra dentro del grupo de páginas que hemos hablado previamente.

En esta web encontraremos todos los datos abiertos que queramos conocer sobre la NHL, tanto de los jugadores como de los equipos, incluso dividido y bien organizado según las conferencias a la que pertenecen los equipos, pero no queda ahí porque además de todo esto tienes los datos de los playoffs de cada año, todo ello con un amplio histórico de temporadas.

Open data en Béisbol

La principal página de datos abiertos de fútbol americano, es https://www.pro-football-reference.com  ya que es una página de referencia sobre el tema, que se encuentra dentro del grupo de páginas que hemos hablado previamente.

En esta web encontraremos todos los datos abiertos que queramos conocer sobre la MLB, tanto de los jugadores como de los equipos, incluso dividido y bien organizado según las conferencias a la que pertenecen los equipos, además de incluir los datos de las dos primeras ligas, pero no queda ahí porque además de todo esto tienes los datos de los playoffs de cada año, todo ello con un amplio histórico de temporadas y jugadores.

Como habrás podido comprobar, hay una gran cantidad de datos abiertos y disponibles para consultar y trabajar con ellos, de muy fácil acceso. Espero haberte ayudado a encontrar páginas de las que te interesen sus datos, y si quieres compartir las tuyas o preguntar por alguna, siéntete libre de dejarlo en los cometarios.

Compártelo:

Deja un comentario Cancelar respuesta