Olá, Meu Nome é Marcos

Cientista de dados

Com foco em desenvolvimento de software

Hero Section
About Me

Sobre Mim

Sempre fui o tipo de pessoa que se questiona o porquê das coisas e que gosta de aprender coisas novas. Tive experiência com projetos multidisciplinares e de ponta a ponta que englobam atividades de Engenharia de dados, Análise de dados, Ciência de dados e desenvolvimento de software/MLOPS


Onde mais gosto de atuar é com o desenvolvimento de software para área de dados, como Data Pipelines, ETL's e MLOps. Gosto bastante da área de desenvolvimento backend, arquitetura de software, Devops e cloud. No frontend gosto de brincar com React!

Experiências

Neurotech

Auxiliar na contribuição com a construção, aperfeiçoamento e aplicação das ferramentas de engenharia de machine learning na plataforma Neurolake sob supervisão.

Principais Projetos


  • Projeto de sistemas de recomendação

    Construção de uma biblioteca em python para construção de modelos de sistema de recomendação.

    Ferramentas: Python, POO, AWS (Personalize), LightFm, Git, Github


  • Projeto de monitoramento de modelos

    Construção de uma API para monitoramento de modelos.

    Ferramentas: Python, POO, FastAPI, AWS(SQS, Lambda, CloudWatch, S3), Git, Github


Comunidade DS



  • Desenvolvimento de projetos de ciência de dados end-to-end, desde a concepção do problema de negócio até a disponibilização dos modelos e/ou análises.

  • Participação em grupos de estudos focados em estatística e Machine Learning.

Ferramentas: Python, Flask, Análise de dados, Visualização de dados, Machine Learning, Deep Learning, Estatística, SQL, web scraping.

Hero Section

Educação

Universidade Federal de Pernambuco

Engenharia de Produção - Cursando

Iniciação científica - PIBIC


TCC

Previsão do Remaining Useful Life (RUL) para rolamentos utillizando modelos de deep learning. Ferramentas: Python, Spectrograma, TensorFlow.

Ferramentas: Python, POO, Git, Github, R (linguagem de programação), TensorFlow, Análise de dados, Deep Learning



Grupo de pesquisa

PIBIC 2019 - 2020: ESTUDO DE MODELOS PARA ANÁLISE DE EFICIÊNCIA AMBIENTAL COM BASE NA GESTÃO DE RESÍDUOS ELETROELETRÔNICOS.

PIBIC 2020 - 2021: ESTUDOS AVANÇADOS DOS MODELOS DE EFICIÊNCIA PARA SUPORTE AO GERENCIAMENTO DE RESÍDUOS ELETROELETRÔNICOS


Publicações


  • Artigo Publicado no SBPO

    USO DA ANÁLISE POR ENVOLTÓRIA DE DADOS (DEA) PARA AVALIAÇÃO DA EFICIÊNCIA NA GESTÃO DE RESÍDUOS ELETROELETRÔNICOS, Nyedja Nayanne Bezerra de Oliveira Santos, Marcos Vinicius Lira Santana, Patrícia Guarnieri, Lucio Silva.


  • Capitulo de Livro

    Capitulo (Avanço na análise de séries temporais, pág 144) de um livro com os melhores trabalhos da disciplina de Análise de séries temporais em R.

Tecnologias

Product Chain

Linguagens de Programação

  • Python
  • JavaScript
  • Node
  • TypeScript
  • Golang
Product Chain

Back-End Frameworks

  • FastApi
  • Flask
  • Django
  • Express
  • Nest
  • Gin
Product Chain

Banco de Dados

  • MySql
  • Postgres
  • SQLite
  • MongoDB
Product Chain

Cloud

  • AWS
  • GCP
  • Docker
  • Kubernetes
  • MLOps
  • RabbitMQ
Product Chain

Dados

  • PySpark
  • Pandas
  • Airflow
  • Tableu
  • Power BI
  • Looker Studio
Product Chain

IA

  • Machine Learning
  • Deep Learning
  • MLflow
  • TensorFlow
  • Scikit-learn

Projetos Principais

Projetos

Placeholder

health_insurance_cross_sell

Construir um modelo que prediz a probabilidade de um cliente ser classificado como uma pessoa que irá querer adquirir o novo seguro. Criação de uma Api para consumo das predições

Placeholder

Redes Neurais convolucionais

Construir um modelo de deep learning para previsão do tempo de vida restante para rolamentos.

Placeholder

Rest Api

CRUD utilizando Typeorm, Typescrip e express com deploy na AWS