Data Lake - Big Data - Palantir Foundry
Qualtop - mexico city
Apply NowDescripción del trabajo
En Qualtop nos especializamos en la ingeniería de software con servicios enfocados en Nube, IA y Data , adoptando un enfoque ágil y centrado en el cliente. Impulsamos la transformación digital y el crecimiento empresarial. Pero más allá de la tecnología, lo que realmente nos impulsa es generar impacto: en nuestros clientes, en la sociedad y en cada persona que forma parte de nuestro equipo. Innovamos con propósito, construimos con visión y trabajamos para dejar huella. DESCRIPCIÓN DEL ROL: Buscamos un Ingeniero de Datos con mentalidad analítica y sólida experiencia técnica para diseñar, construir y optimizar arquitecturas de datos a gran escala. El candidato ideal será el puente entre el almacenamiento crudo en GCP y la capa de valor de negocio en Palantir Foundry , asegurando que los flujos de datos sean eficientes, escalables y gobernados. Responsabilidades: Desarrollo de Pipelines: Diseñar y mantener procesos ETL/ELT complejos utilizando Spark y Python para procesar volúmenes masivos de datos. Gestión en Palantir Foundry: Implementar flujos de trabajo dentro del ecosistema Foundry, utilizando Pipeline Builder para transformaciones visuales y Code Repositories para lógica personalizada. Orquestación y Nube: Configurar y monitorear mallas de datos en Google Cloud Platform , gestionando flujos mediante Airflow (Cloud Composer) y clusters de Dataproc . Modelado de Datos: Estructurar capas de datos en BigQuery y asegurar la integración fluida con motores relacionales como PostgreSQL, Oracle y SQL Server. Calidad y Linaje: Garantizar la trazabilidad del dato mediante herramientas de Data Lineage y asegurar que la información esté disponible para análisis avanzado en Contour o herramientas de terceros. Colaboración Técnica: Aplicar mejores prácticas de desarrollo de software, incluyendo control de versiones con Git y revisión de código. PERFIL PROFESIONAL: Stack Tecnológico Lenguajes: Python (Avanzado), SQL (Avanzado). Big Data Frameworks: Spark (Avanzado). Cloud Computing & Data Orchestration (Google Cloud Platform - Intermedio) Ecosistema GCP: Google Cloud Platform, Google Cloud Shell, Google Storage. Orquestación y Pipelines: Airflow, Google Cloud Composer, Dataproc (Spark/Hadoop managed). Data Warehouse: BigQuery (Intermedio). ETL & Procesamiento: Dataflow (Básico/Deseable). Bases de Datos y Análisis Motores de DB: MySQL, PostgreSQL, Oracle, SQL Server. Herramientas de Analítica: SAS (Intermedio), Pandas (Básico/Deseable), Excel/Google Sheets. Plataformas de Datos: Palantir Foundry (Pipeline Builder, Data Lineage, Contour, Code Repositories). Herramientas de Desarrollo y Control Control de Versiones: Git (Intermedio). IDE: VS Code (u otros entornos de desarrollo para Python). Vertex AI Certificación Google Cloud Professional Data Engineer ¿Por qué unirte a Qualtop? Más allá de la tecnología, nos importa tu crecimiento. Aquí encontrarás retos constantes donde tu aprendizaje va de la mano con tu impacto en la sociedad y en la industria.
Creado: Jue, 01 de Ene de 1970