Lead Data Scientist
(Oferta Cerrada)
En GoKoan desarrollamos productos para que los alumnos aprendan más en menos tiempo. Inicialmente, y como prueba de concepto, hemos focalizado esfuerzos en el mundo de las oposiciones, donde la presión y el volumen de información a aprender son enormes. Pero nuestra visión y producto es agnóstica del sector.
Nuestro futuro Lead Data Scientist abrirá el departamento de Data Science e iniciará el desarrollo de nuestro siguiente proyecto de I+D+I: Mushi, con el que pretendemos aplicar los últimos avances en NLP para lograr que el aprendizaje de las máquinas ayude al aprendizaje humano de una forma óptima.
El/la Lead Data Scientist trabajará junto con otros ingenieros y el CTO en la definición de estrategias de capacitación técnica y humana del equipo, el diseño y ejecución de experimentos en NLP para validar/descartar líneas de trabajo relacionadas con aspectos como, la generación de resúmenes abstractivos, extracción de ideas clave, generación de preguntas, detección de sentimientos en los posts de la comunidad interna de usuarios, etc.
El/la candidato/a debe ser un data scientist excepcionalmente disciplinado y auto-motivado, con experiencia en el NLP, modelado predictivo, y analítica avanzada, y con pasión por el trabajo con datos en texto.
El rol ofrece una excelente oportunidad para trabajar en tecnologías punteras en el mercado (Big Data, Cloud, Artificial Intelligence, Machine Learning, Natural Language Processing, Automatic Speech Recognition) con un equipo muy competente en Valencia.
NOTA: Esta es una posición preferiblemente en Valencia, España, donde ofrecemos un modelo híbrido (oficina y remoto). Tenemos unas oficinas fantásticas, junto a la Universidad Politécnica de Valencia, con buenas conexiones de metro, bus, y coche. No obstante, consideramos la opción de un trabajo full remote, siempre y cuando haya disponibilidad para venir a Valencia en periodos que lo necesitaran (el onboarding, presentaciones clave, visitas de team building).
Tus actividades
Revisar y rediseñar la estrategia de NLP de la compañía, junto al CTO.
Colaborar con el Product Owner para refinar los requerimientos de producto y construir especificaciones sólidas.
Procesar y analizar datos de texto y usuarios para ingeniería de características con las que construir los modelos que darán soporte a las futuras características de Mushi.
Construir sistemas IA que generen texto que ayude a los estudiantes a aprender más rápido: resúmenes abstractivos, extracción de entidades y relaciones clave, respuesta automática de preguntas, generación automática de preguntas, etc.
Construir sistemas IA que automáticamente identifiquen insights en textos que resulten en recomendaciones accionables.
Desarrollar soluciones creativas y construir prototipos para problemas de negocio, usando algoritmos estadísticos y de machine learning, y trabajar con ingeniería/producto para llevarlos a producción.
Articular preguntas de negocio y usar técnicas matemáticas para llegar a una respuesta informada en datos. Traducir esos resultados en recomendaciones de negocio.
Coordinarse y trabajar con el equipo de ingeniería y desarrollo para llevar los modelos y algoritmos a producción.
Diseñar y construir dashboards en Metabase (nuestra herramienta de BI)
Crear y registrar métricas de rendimiento y precisión (tanto técnicas como de negocio)
Crear, mejorar, y mantener documentación técnica, y presentar a otros científicos, ingenieros y responsables de negocio.
Liderar buenas prácticas.
Habilidades clave
Buen comunicador, buenas habilidades de documentación, jugador en equipo.
Automotivado, disciplinado y orientado a resultados.
Fuertes habilidades en resolución de problemas y dificultades.
Grado universitario en Informática, Matemáticas, o campo relacionado.
2+ años de experiencia en un rol similar o muy cercano.
Inglés medio-alto.
2+ años de experiencia con lenguajes de scripting (p.e. Python, R, SQL, etc.) o software estadístico/matemático (R, Matlab).
1+ años de experiencia real en data science y machine learning con registro demostrable de impacto positivo en el negocio.
Conocimiento profundo de modelos estadísticos y de machine learning (logistic regression, decision trees, SVMs, etc.), clustering, y técnicas de clasificación.
Experiencia probada construyendo modelos y llevándolos a producción.
Experiencia en problemas de optimización, y resolver esos problemas a escala.
Experiencia en versionado de modelos ML y datasets.
Experiencia con SQL, Metabase/Tableau y/o cualquier otra herramienta de visualización.
Habilidades extra deseables
Master/Grado en Computer Science, Estadística, Matemáticas Aplicadas, Ingeniería Eléctrica, o campo relacionado.
Experiencia con procesado natural del lenguaje (NLP) y aplicarlo en problemas prácticos reales.
Conocimiento de la infraestructura de AWS o de otro proveedor cloud.
Experiencia con CD4ML para asegurar la calidad en el proceso de ML.
Experiencia con gestión de datos y/o computación de alto rendimiento.
Experiencia trabajando en entornos Linux desde línea de comando.
Experiencia con Docker y Kubernetes (sería un gran plus).
¿Cómo me apunto a la oferta?
La oferta está cerrada, pero siempre estamos abiertos a conocer personas nuevas. Escribe un email a mike@gokoan.com explicando por qué quieres unirte a GoKoan.