Metodología y Fuentes de Datos
Transparencia total sobre cómo obtenemos, procesamos y visualizamos la información pública.
Fuentes de Información
MercadoPúblico (API)
Conectamos directamente con la API de MercadoPúblico para obtener datos en tiempo real sobre licitaciones, órdenes de compra y tratos directos de todos los organismos del Estado.
Datos Abiertos (CKAN)
Descargamos y procesamos datasets históricos disponibles en los portales de datos abiertos del Gobierno para análisis de tendencias a largo plazo.
Superintendencia de Salud
Cruzamos información de prestadores de salud y precios referenciales para detectar anomalías en las compras del sector sanitario.
MINEDUC
Utilizamos los registros de subvenciones escolares y matrícula para contextualizar el gasto en educación pública.
Procesamiento de Datos (ETL)
Nuestro pipeline de datos (Extract, Transform, Load) ejecuta procesos diarios para asegurar la calidad de la información:
- Extracción: Scripts automatizados consultan las fuentes oficiales cada 24 horas.
- Normalización: Unificamos nombres de proveedores y organismos que suelen aparecer con distintas grafías (ej: "Muni. Santiago" vs "I. Municipalidad de Santiago").
- Enriquecimiento: Agregamos metadatos adicionales, como clasificación por rubro (Salud, Obras, Tecnología) utilizando algoritmos de procesamiento de texto.
- Carga: Los datos limpios se almacenan en nuestra base de datos segura para ser consultados por la plataforma web.
Privacidad y Seguridad
DatoPúblico.cl solo trabaja con información de carácter público según la Ley de Transparencia (Ley 20.285). No almacenamos ni publicamos datos personales sensibles de ciudadanos particulares, salvo aquellos que sean proveedores del Estado y cuya información sea pública por ley.
Código Abierto
Creemos que la herramienta para fiscalizar también debe ser transparente. Parte de nuestro código, especialmente los scripts de procesamiento de datos, estará disponible próximamente en nuestro repositorio de GitHub para auditoría comunitaria.