AI Engineer

  • Indefinido
  • Tiempo completo
  • Teletrabajo

Sobre Kashio

En Kashio desarrollamos tecnología financiera para que las empresas adopten pagos digitales y automaticen sus operaciones de CxC y CxP. Acompañamos a 500+ clientes en educación, finanzas, real estate, utilities y más, y estamos próximos a operar en 5 mercados.

Construimos una plataforma segura, intuitiva y de alto desempeño; nuestra cultura valora la propiedad (ownership), la colaboración, el aprendizaje continuo y el impacto.

El desafío

Buscamos un/a Senior AI/ML Engineer para crear, integrar y escalar servicios y experiencias de producto impulsadas por IA sobre nuestros flujos de pagos y conciliaciones. Tu trabajo conectará PSPs y pasarelas, orquestará eventos y webhooks con idempotencia, y llevará a producción features de ML/GenAI (detección de anomalías, scoring de riesgo, RAG sobre datos financieros, automatizaciones de cobranza) con MLOps real.

Lo que harás

Responsabilidades Principales (80% del tiempo)

1. Servicios de IA en Producción (40%)

  • Diseñar, entrenar y desplegar modelos de ML/DL/GenAI (LLMs, embeddings, RAG, NLP) con SageMaker/Bedrock o Vertex/Azure ML

  • Versionar modelos con MLflow y monitorear deriva/latencia en producción

  • Exponer inferencias vía APIs y microservicios (REST/gRPC) con versionado y SLAs claros

  • Optimizar costos y latencia de inferencias en producción

2. Backend & APIs (30%)

  • Construir endpoints en Node.js/TypeScript o Python/FastAPI con OpenAPI/Swagger

  • Implementar seguridad OAuth2/JWT, idempotencia y rate-limiting

  • Integrar la capa de IA en journeys de pagos (webhooks, contracargos, conciliaciones, scoring)

  • Construir arquitecturas event-driven (SQS/SNS/Kafka) con retries/backoff y circuit breakers

3. Integración de Producto (20%)

  • Colaborar con frontend para consolas de monitoreo de IA y vistas de conciliación inteligente

  • Implementar explicabilidad (feature importance, SHAP/metrics) en interfaces

  • Priorizar UX, performance y accesibilidad en integraciones de IA

4. MLOps & Calidad (10%)

  • Automatizar CI/CD de datos/modelos (GitHub Actions/GitLab CI, IaC con Terraform/CDK)

  • Implementar trazabilidad y Data Lineage, tests de datos (contract, schema, drift)

  • Configurar monitoring (Prometheus/Grafana/OpenTelemetry)

Proyectos de Ejemplos en los que Podrias Trabajar

  1. Sistema RAG para Consultas Financieras: Construir sistema de búsqueda semántica sobre transacciones usando embeddings (OpenAI/Cohere) y vector DB (OpenSearch/pgvector) para permitir consultas naturales sobre datos financieros

  1. Modelo de Scoring de Riesgo: Desarrollar modelo ML para priorizar cobranzas usando features históricas (tasa de pago, monto, antigüedad) y desplegarlo en producción con monitoreo continuo

  1. Detección de Anomalías en Tiempo Real: Implementar sistema de detección de transacciones sospechosas usando modelos de ML en streaming (Kafka + Lambda/SageMaker)

  1. Automatización de Conciliaciones: Usar NLP y matching fuzzy para automatizar matching de referencias entre transacciones de PSPs y registros contables

  1. Chatbot Asistido por LLM: Construir asistente interno para soporte sobre procesos de pago usando fine-tuning o RAG sobre documentación interna

Responsabilidades Secundarias

  • Colaborar en desarrollo frontend (React + TypeScript) para dashboards internos

  • Trabajar con Producto, Operaciones, Compliance y PSPs

  • Participar en ceremonias ágiles, escribir RFCs y realizar code reviews

  • Diseñar con privacy-by-design, KMS/Secrets Manager, OWASP Top 10, sensibilidad PCI DSS e ISO 27001

Deberás conocer

Tecnologías Core (Must Have)

Backend:

  • Node.js (TypeScript) o Python (FastAPI/Flask)

  • Principios SOLID, OOP/FP

  • OpenAPI/Swagger

ML/AI:

  • Python (pandas, scikit-learn, PyTorch/TensorFlow)

  • LangChain o frameworks similares

  • MLflow para versionado

  • RAG (vector DB: OpenSearch/pgvector/FAISS)

Cloud/Infra:

  • AWS (Lambda, ECS/EKS, API Gateway, S3, SQS/SNS, CloudWatch, SageMaker/Bedrock)

  • Docker, Kubernetes básico

  • Terraform o CDK básico

Datos:

  • SQL avanzado (PostgreSQL/MySQL)

  • NoSQL básico (DynamoDB/DocumentDB)

Testing:

  • Unit/integration testing

  • Linting/formatting

Seguridad:

  • OAuth2/JWT

  • KMS/Secrets Manager

  • Firma y validación de webhooks

Tecnologías Importantes (Should Have)

  • MLflow avanzado, Feature Store (SageMaker/Feast)

  • React + TypeScript (básico, puede aprenderse)

  • Airflow, Spark/PySpark

  • OpenTelemetry, Prometheus/Grafana

  • CI/CD productivo (GitHub Actions/GitLab CI)

Tecnologías Plus (Nice to Have)

  • Next.js, GraphQL, gRPC

  • GCP/Azure (Vertex AI/Azure ML, Databricks)

  • Snowflake/BigQuery/Redshift

  • Kafka, RabbitMQ

  • Frontend avanzado (React Query/Zustand/Redux, Tailwind, Jest/RTL)

Requisitos

  • 5+ años de experiencia técnica total

  • 3+ años aplicando ML/AI en producción (ML clásico y/o DL/GenAI)

  • 2+ años desarrollando backend (Node.js/Python)

  • Experiencia en cloud (AWS preferido, mínimo Lambda/ECS + SQS/SNS + API Gateway + S3 + CloudWatch)

  • Python y SQL avanzados

  • Experiencia real con LLMs/embeddings/RAG y MLOps (MLflow/SageMaker Pipelines/Vertex Pipelines)

  • Mentalidad de seguridad y performance: idempotencia, concurrencia, timeouts, retries, backoff, circuit breakers

Destacarias si conoces y/o posees experiencia en

  • Integraciones con PSPs de LATAM (webhooks, settlement, conciliaciones, tokenización)

  • Kafka, GraphQL o gRPC

  • Databricks, Snowflake/BigQuery/Redshift

  • Experiencia aplicando IA a FinOps (detección de anomalías, scoring de riesgo, priorización de cobros)

  • Explainability avanzada (SHAP/LIME)

  • Sensibilidad regulatoria LATAM + familiaridad PCI DSS / ISO 27001

  • Experiencia construyendo UIs internas (dashboards/console) para monitoreo de modelos

  • Pensamiento sistémico: Entender impacto de modelos ML en flujos de negocio y experiencia de usuario

  • Comunicación técnica: Explicar modelos complejos y decisiones técnicas a stakeholders no técnicos (Producto, Compliance, Operaciones)

  • Ownership: Responsabilidad end-to-end desde diseño hasta monitoreo en producción, sin "tirar la pelota"

  • Mentalidad de producto: Balancear perfección técnica con velocidad de entrega y valor de negocio

  • Resiliencia: Manejar presión de sistemas en producción 24/7, debugging bajo presión

  • Curiosidad y aprendizaje continuo: Mantenerse actualizado en rápidos cambios de GenAI/LLMs y mejores prácticas

  • Team-player: Comunicación clara, escucha activa, colaboración efectiva con equipos multidisciplinarios

  • Asertividad: Obsesión con calidad, seguridad y observabilidad, sin comprometer velocidad