michaowBieroński,波兰Kraków的开发者
Michał is available for hire
Hire Michał

Michał Bieroński

Verified Expert  in Engineering

机器学习工程师和软件开发人员

Location
Kraków, Poland
Toptal Member Since
January 21, 2022

michaov在数据科学领域拥有近9年的专业经验, machine learning, 以及软件开发. 他有计算机科学背景,可以胜任数据科学家和机器学习工程师的角色. 迈克尔已经解决了对话式人工智能中的多个问题, NLP, computer vision, 时间序列预测, 社交媒体分析, 从图结构数据中学习, 供应链分析, data visualization, 以及生产部署.

Portfolio

Skillz
雪花、MLflow、Apache气流、Apache Spark、亚马逊网络服务(AWS)...
BP
Python, Scikit-learn, Azure, Azure机器学习,Azure数据工厂...
Infosys
BERT, Streamlit, Dash, Azure, Scikit-learn, GitLab, GitLab CI/CD...

Experience

Availability

Part-time

Preferred Environment

Linux, PyCharm, Git, Zsh

The most amazing...

...我开发的是Matchmaking Simulator, ai引擎将新玩家D30留存率提升了33%,D30收益提升了11%.

Work Experience

Senior Data Scientist

2021 - PRESENT
Skillz
  • 通过构建AI玩家模型(结合多个行为ML模型)并在Python中复制生产配对引擎来构建Matchmaking Simulator引擎,以允许快速实验. 这台发动机仍在使用.
  • 利用模拟器改进了配对引擎并开发了新的算法, D30留存率提升33%,D30收益提升11%. 领导团队内部部署、监控影响和扩展已开发特性的工作.
  • 建立了一个转换ML模型,并将其集成为配对模拟器的一个组件, 允许对公司如何提高转化率进行实验.
  • 使用AWS操作客户流失预测模型, Docker, Kubernetes, GitHub Actions, MLflow, Airflow, and Snowflake.
  • 研究行业标准解决方案, 构建仿真框架, 选择最可行的解决方案, 并实现了生产就绪的代码, 允许多人游戏的有效评级更新.
  • 负责牵线搭桥,为领导和商业利益相关者提供建议和回答问题. 领导实验和分析配对工作. 与工程,分析和产品部门合作.
  • 计划和监督一个初级团队成员的工作.
Technologies: 雪花、MLflow、Apache气流、Apache Spark、亚马逊网络服务(AWS), Java, Groovy, Python, Scikit-learn, XGBoost, Streamlit, Amazon S3 (AWS S3), Amazon EC2, Amazon弹性容器服务(Amazon ECS), Amazon SageMaker, Algorithms, Machine Learning, Data Science, 人工智能(AI), SQL, NumPy, Pandas, DVC, Pytest, 持续集成(CI)

高级机器学习工程师

2020 - 2021
BP
  • 在Azure云中为数据分析平台的开发和生产设计并构建云架构.
  • 使用ADF等平台和工具, Azure Data Lake, Azure Databricks, Azure DevOps, Azure Key Vault, Delta Lake, MLflow, Azure机器学习, Azure Kubernetes服务, Azure Synapse Analytics, and Power BI.
  • Preprocessed, cleaned, 并识别训练数据中的异常值,以便与业务进一步检查. 使用的一些示例技术是DBSCAN和隔离林.
  • 基于历史数据,建立了石油钻井相关活动成本预测的DNN回归模型. 使用PyTorch和PyTorch闪电.
  • 进行实验和方差分析(ANOVA)等统计测试,并应用人工智能解决方案.
  • 管理成本预测过程的人工和开销的云自动化, 以前由分析师在Excel表格中手动完成.
  • 管理Databricks云数据分析平台. 使用PySpark构建和优化现有的ETL管道. 在项目中引入了带有Azure应用程序洞察力的生产监控.
  • 维护和发展时间序列预测库. 管理生产部门提交季度成本预测, 利用多处理将季度预测的运行时间减少了14倍.
  • 使用FastAPI构建和部署web API, Docker, 和Azure Web App来实现时间序列模型,使公司内部的非数据科学家也可以访问它们. 构建Power BI报告,展示API的使用情况.
  • 创建了将最新版本的内部时间序列预测库自动部署到Spark集群的管道. 在Azure DevOps上构建CI管道, 运行代码质量检查和单元测试,并对团队进行培训.
Technologies: Python, Scikit-learn, Azure, Azure机器学习,Azure数据工厂, Azure Data Lake, Databricks, Azure Key Vault, Delta Lake, MLflow, Azure Kubernetes服务(AKS), Azure容器实例, Azure Functions, Azure Synapse, Microsoft Power BI, PySpark, Spark, 机器学习操作(MLOps), Azure DevOps, ETL, Web Applications, FastAPI, Time Series Analysis, Azure应用程序洞察, Docker, Azure容器注册表, PyTorch, DNN, Pytest, Plotly, Statistics, SQL Server 2017, SQL, Apache Spark, Containerization, DevOps, NumPy, Pandas, Neural Networks, Time Series, Algorithms, Machine Learning, Deep Learning

Senior Data Scientist

2020 - 2021
Infosys
  • 使用Dash技术处理市场营销,为快速消费品行业推荐系统开发并部署商业智能仪表板,帮助营销团队更好地了解和定位客户.
  • 管理银行供应链分析. 给定内部银行交易数据, 我开发了一个解决方案,用于分析一些业务实体的违约对其他业务的影响.
  • 领导一个学术机构的PoC项目,该项目后来成为一项长期合作, 旨在使用知识图以自然语言回答问题. 该解决方案利用内置意图分类和命名实体识别(NER)。.
  • 领导一个非结构化数据洞察项目. 它的目标是使用主题建模(LDA)和情感分析(BERT)等技术模型来深入了解非结构化的原始文本数据。.
  • 为数据科学行业的职位进行面试, such as data analysts, data scientists, and data engineers.
Technologies: BERT, Streamlit, Dash, Azure, Scikit-learn, GitLab, GitLab CI/CD, Microsoft PowerPoint, SpaCy, NetworkX, Docker, Docker Compose, Code Review, Plotly, Data Science, 人工智能(AI), DevOps, Containerization, Machine Learning, Deep Learning, PyTorch, SQL, NoSQL

机器学习工程师

2019 - 2020
IamBot
  • 研究并开发了最先进的自然语言处理系统, conversational engine, 以及聊天机器人产品推荐解决方案的图像表示.
  • 分布式GPU深度学习模型训练大容量数据.
  • 处理核心产品的全栈开发和维护. Play Framework的后端使用Scala, Spring Java, React TypeScript的前端, 以及使用Python和Scala等gRPC微服务部署机器学习模型.
  • 领导了一个名为“密码狗”的外部创业公司的子项目. 构建了核心应用程序功能,如加密,私钥备份,以及与Java和gRPC聊天.
Technologies: Python, gRPC, Docker, Kubernetes, 自然语言处理(NLP), 生成预训练变压器(GPT), GPT, Chatbots, Scala, Java, Spring, Play Framework, React, TypeScript, NumPy, Pandas, Machine Learning, Deep Learning, 亚马逊网络服务(AWS), NoSQL, PyTorch

Software Developer

2016 - 2018
Nokia
  • 维护和开发各种与项目相关的技术栈(如Python)的内部项目, Django, Angular, Vue.js, and Backbone.Js,以及服务器、客户端和端到端测试的复杂测试.
  • 将Docker引入团队,并开发了一种无需使用docker化环境模拟服务器端的端到端测试方法.
  • 管理服务器端管理,如Nginx, repository hooks, automating builds, and CI, Docker Registry, Sentry, and Celery jobs.
技术:Python, Django, Django REST框架,Angular, Vue, Backbone.js, E2E Testing, Docker, Jenkins, CI/CD Pipelines, Sentry, PostgreSQL, Celery, Bash, Linux, JavaScript, TypeScript, 测试驱动开发(TDD), Scrum, DevOps, Containerization

Java Summer Trainee

2016 - 2016
Nokia
  • 开发了一个CI插件,通过版本控制系统自动将c++编译错误与负责破坏代码的人联系起来.
  • 在Jenkins CI/CD和产品维护中部署插件.
  • 开发了基于IntelliJ平台的TTCN-3编程语言定制IDE.
技术:Java, Jenkins, Bash, IntelliJ IDEA

Meme Learning

http://gitlab.com/meme2vec
基于Meme2vec方法的模因推荐系统, 基于社交的模因矢量化, visual, 文本嵌入以及基于文本的模因分类模型.

该模型进一步用于创建Slack和Discord机器人,为给定文本选择最匹配的模因模板, 然后创建一个表情包并将其发送给用户. 该项目赢得了数据科学项目的内部大学海报会议和波兰人工智能发展联盟(PP-RAI)会议的海报会议.

车牌识别

http://gitlab.com/bieruskate/license-plate-recognition
该项目结合了经典的车牌图像处理和字符分割方法,以及在自建数据集上训练的字符分类定制深度学习模块.

其目标是检测和识别不同光照条件下的车牌字符,并与其他可用的解决方案进行综合评估和比较.
2018 - 2019

数据科学硕士学位

Wrocław波兰科技大学Wrocław

2014 - 2018

计算机科学学士学位

Wrocław波兰科技大学Wrocław

2021年11月至今

Azure数据科学家助理|微软认证

Microsoft

APRIL 2021 - PRESENT

Azure基础|微软认证

Microsoft

APRIL 2016 - PRESENT

CCNA路由与交换|网络导论

Cisco

Libraries/APIs

Pandas, PySpark, PyTorch, NumPy, Beautiful Soup, React, Vue, Backbone.. js, Scikit-learn, SpaCy, NetworkX, Keras, TensorFlow, OpenCV, Matplotlib, XGBoost

Tools

PyCharm, Git, Zsh, Docker Compose, Azure机器学习, Jenkins, IntelliJ IDEA, Sentry, Celery, GitLab, GitLab CI/CD, Microsoft PowerPoint, Azure Key Vault, Azure Kubernetes服务(AKS), Microsoft Power BI, Azure应用程序洞察, Pytest, Seaborn, Plotly, Apache Airflow, Amazon弹性容器服务(Amazon ECS), Amazon SageMaker

Languages

Python, Scala, Java, TypeScript, Bash, TTCN, JavaScript, SQL, Snowflake, Groovy

Frameworks

Apache Spark, Spark, gRPC, Spring, Play Framework, Django, Django REST Framework, Angular, Streamlit, Scrapy

Paradigms

Data Science, DevOps, Azure DevOps, E2E Testing, ETL, 测试驱动开发(TDD), Scrum, 持续集成(CI)

Storage

PostgreSQL, SQL Server 2017, NoSQL, Amazon S3 (AWS S3)

Platforms

Linux, Docker, Databricks, Azure, Kubernetes, Azure Functions, Azure Synapse, DNN, 亚马逊网络服务(AWS), Amazon EC2

Other

Machine Learning, 人工智能(AI), 机器学习操作(MLOps), 自然语言处理(NLP), GPT, 生成预训练变压器(GPT), Chatbots, MLflow, CI/CD Pipelines, BERT, Dash, Code Review, Azure Data Factory, Azure Data Lake, Delta Lake, Azure容器实例, FastAPI, Time Series Analysis, Azure容器注册表, Statistics, Computer Networking, Data Scraping, Scraping, Web Scraping, Containerization, Neural Networks, Time Series, Algorithms, Deep Learning, Web Applications, DVC

有效的合作

如何使用Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring