CIENTISTA DADOS
Job Summary
- Atuar no desenvolvimento e evolução de soluções de dados e inteligência analítica voltadas ao negócio agrícola apoiando produtos digitais atuais e futuros da LDC.
- Preparar validar e disponibilizar datasets operacionais e analíticos provenientes de sistemas agrícolas e corporativos (ex.: inspeções operações de campo aplicações estoque histórico operacional) assegurando qualidade consistência e rastreabilidade.
- Desenvolver e manter transformações de dados em Python e SQL com execução preferencial (mas nao somente) em Azure Databricks (PySpark) estruturando dados para consumo por aplicações analíticas modelos e soluções de IA.
- Apoiar a construção e evolução de pipelines de dados (ETL/ELT) com foco em escalabilidade padronização reutilização e aderência às boas práticas de engenharia de dados da companhia.
- Contribuir com a criação e manutenção de bases de conhecimento técnico e de negócio estruturadas para consumo por soluções analíticas e de inteligência artificial garantindo alinhamento com fontes oficiais e regras corporativas.
- Apoiar o desenvolvimento de camadas de lógica determinística e regras de negócio (ex.: dicionários de dados mapeamento de entidades regras de filtragem e validação) reforçando confiabilidade e interpretabilidade das soluções.
- Criar e manter testes validações e controles de qualidade assegurando estabilidade das soluções à medida que novos dados funcionalidades ou produtos forem incorporados.
- Documentar entregas técnicas decisões de modelagem e fluxos de dados apoiando a maturação de iniciativas de dados e IA desde provas de conceito até produtos escaláveis e governados.
- E outras atividades correlatas.
Qualifications :
Requisitos Obrigatórios:
- Python para análise e manipulação de dados (pandas; desejável PySpark skit-learn sklearn matplotlib numpy scipy pandas dash-plotly datascience tools geopandas) - boas práticas de código (ambientes/venv organização de pacotes) testes (pytest quando aplicável) e notebooks reprodutíveis.
- SQL avançado incluindo modelagem e consultas em grandes volumes de dados.
- Conhecimento prático de ETL/ELT qualidade e validação de dados.
- Experiência ou base sólida em Azure Databricks (notebooks jobs pipelines).
- Conhecimento de Big Data/lakehouse (mercado): conceitos de Spark Delta Lake particionamento e boas práticas de performance em ambientes distribuídos.
Desejável:
- Experiência prévia com Spark dados geoespaciais ou dados agrícolas.
- Experiência com séries temporais e dados climáticos (ex.: previsão/monitoramento anomalias) comuns em cenários agrícolas.
- Conhecimento em sensoriamento remoto (ex.: índices de vegetação como NDVI) GIS (QGIS) e/ou banco geoespacial (ex.: PostGIS).
Informações adicionais :
Disponibilidade para atuar presencialmente em Bebedouro/SP;
Diversidade Inclusão e Equidade
A diversidade é parte do nosso DNA. A LDC busca sempre criar um ambiente de trabalho diversificado e inclusivo onde todas as pessoas possam prosperar. Respeitamos e valorizamos talentos de todos os gêneros idades raças etnias sexualidades religiões e deficiências. Diversidade é um de nossos valores! Essa oportunidade destina-se também às pessoas com deficiências (PcD).
Sustentabilidade
O valor sustentável está no centro de nosso propósito como empresa.
Somos apaixonados pela criação de valor justo e sustentável tanto para nossos negócios quanto para outros stakeholders da cadeia de valor: nosso pessoal nossos parceiros comerciais as comunidades e o meio ambiente ao nosso redor.
Remote Work :
No
Employment Type :
Full-time
About Company
Você conhece a LDC? A LDC é uma das principais comercializadoras e processadoras global de produtos agrícolas, com um portfólio diversificado, que abrange toda a cadeia de valor, da originação à distribuição. Com atividades no centro da produção agrícola e de alimentos e guiados pelos ... View more