Michał Bieroński
Verified Expert in Engineering
机器学习工程师和软件开发人员
michaov在数据科学领域拥有近9年的专业经验, machine learning, 以及软件开发. 他有计算机科学背景,可以胜任数据科学家和机器学习工程师的角色. 迈克尔已经解决了对话式人工智能中的多个问题, NLP, computer vision, 时间序列预测, 社交媒体分析, 从图结构数据中学习, 供应链分析, data visualization, 以及生产部署.
Portfolio
Experience
Availability
Preferred Environment
Linux, PyCharm, Git, Zsh
The most amazing...
...我开发的是Matchmaking Simulator, ai引擎将新玩家D30留存率提升了33%,D30收益提升了11%.
Work Experience
Senior Data Scientist
Skillz
- 通过构建AI玩家模型(结合多个行为ML模型)并在Python中复制生产配对引擎来构建Matchmaking Simulator引擎,以允许快速实验. 这台发动机仍在使用.
- 利用模拟器改进了配对引擎并开发了新的算法, D30留存率提升33%,D30收益提升11%. 领导团队内部部署、监控影响和扩展已开发特性的工作.
- 建立了一个转换ML模型,并将其集成为配对模拟器的一个组件, 允许对公司如何提高转化率进行实验.
- 使用AWS操作客户流失预测模型, Docker, Kubernetes, GitHub Actions, MLflow, Airflow, and Snowflake.
- 研究行业标准解决方案, 构建仿真框架, 选择最可行的解决方案, 并实现了生产就绪的代码, 允许多人游戏的有效评级更新.
- 负责牵线搭桥,为领导和商业利益相关者提供建议和回答问题. 领导实验和分析配对工作. 与工程,分析和产品部门合作.
- 计划和监督一个初级团队成员的工作.
高级机器学习工程师
BP
- 在Azure云中为数据分析平台的开发和生产设计并构建云架构.
- 使用ADF等平台和工具, Azure Data Lake, Azure Databricks, Azure DevOps, Azure Key Vault, Delta Lake, MLflow, Azure机器学习, Azure Kubernetes服务, Azure Synapse Analytics, and Power BI.
- Preprocessed, cleaned, 并识别训练数据中的异常值,以便与业务进一步检查. 使用的一些示例技术是DBSCAN和隔离林.
- 基于历史数据,建立了石油钻井相关活动成本预测的DNN回归模型. 使用PyTorch和PyTorch闪电.
- 进行实验和方差分析(ANOVA)等统计测试,并应用人工智能解决方案.
- 管理成本预测过程的人工和开销的云自动化, 以前由分析师在Excel表格中手动完成.
- 管理Databricks云数据分析平台. 使用PySpark构建和优化现有的ETL管道. 在项目中引入了带有Azure应用程序洞察力的生产监控.
- 维护和发展时间序列预测库. 管理生产部门提交季度成本预测, 利用多处理将季度预测的运行时间减少了14倍.
- 使用FastAPI构建和部署web API, Docker, 和Azure Web App来实现时间序列模型,使公司内部的非数据科学家也可以访问它们. 构建Power BI报告,展示API的使用情况.
- 创建了将最新版本的内部时间序列预测库自动部署到Spark集群的管道. 在Azure DevOps上构建CI管道, 运行代码质量检查和单元测试,并对团队进行培训.
Senior Data Scientist
Infosys
- 使用Dash技术处理市场营销,为快速消费品行业推荐系统开发并部署商业智能仪表板,帮助营销团队更好地了解和定位客户.
- 管理银行供应链分析. 给定内部银行交易数据, 我开发了一个解决方案,用于分析一些业务实体的违约对其他业务的影响.
- 领导一个学术机构的PoC项目,该项目后来成为一项长期合作, 旨在使用知识图以自然语言回答问题. 该解决方案利用内置意图分类和命名实体识别(NER)。.
- 领导一个非结构化数据洞察项目. 它的目标是使用主题建模(LDA)和情感分析(BERT)等技术模型来深入了解非结构化的原始文本数据。.
- 为数据科学行业的职位进行面试, such as data analysts, data scientists, and data engineers.
机器学习工程师
IamBot
- 研究并开发了最先进的自然语言处理系统, conversational engine, 以及聊天机器人产品推荐解决方案的图像表示.
- 分布式GPU深度学习模型训练大容量数据.
- 处理核心产品的全栈开发和维护. Play Framework的后端使用Scala, Spring Java, React TypeScript的前端, 以及使用Python和Scala等gRPC微服务部署机器学习模型.
- 领导了一个名为“密码狗”的外部创业公司的子项目. 构建了核心应用程序功能,如加密,私钥备份,以及与Java和gRPC聊天.
Software Developer
Nokia
- 维护和开发各种与项目相关的技术栈(如Python)的内部项目, Django, Angular, Vue.js, and Backbone.Js,以及服务器、客户端和端到端测试的复杂测试.
- 将Docker引入团队,并开发了一种无需使用docker化环境模拟服务器端的端到端测试方法.
- 管理服务器端管理,如Nginx, repository hooks, automating builds, and CI, Docker Registry, Sentry, and Celery jobs.
Java Summer Trainee
Nokia
- 开发了一个CI插件,通过版本控制系统自动将c++编译错误与负责破坏代码的人联系起来.
- 在Jenkins CI/CD和产品维护中部署插件.
- 开发了基于IntelliJ平台的TTCN-3编程语言定制IDE.
Experience
Meme Learning
http://gitlab.com/meme2vec该模型进一步用于创建Slack和Discord机器人,为给定文本选择最匹配的模因模板, 然后创建一个表情包并将其发送给用户. 该项目赢得了数据科学项目的内部大学海报会议和波兰人工智能发展联盟(PP-RAI)会议的海报会议.
车牌识别
http://gitlab.com/bieruskate/license-plate-recognition其目标是检测和识别不同光照条件下的车牌字符,并与其他可用的解决方案进行综合评估和比较.
Education
数据科学硕士学位
Wrocław波兰科技大学Wrocław
计算机科学学士学位
Wrocław波兰科技大学Wrocław
Certifications
Azure数据科学家助理|微软认证
Microsoft
Azure基础|微软认证
Microsoft
CCNA路由与交换|网络导论
Cisco
Skills
Libraries/APIs
Pandas, PySpark, PyTorch, NumPy, Beautiful Soup, React, Vue, Backbone.. js, Scikit-learn, SpaCy, NetworkX, Keras, TensorFlow, OpenCV, Matplotlib, XGBoost
Tools
PyCharm, Git, Zsh, Docker Compose, Azure机器学习, Jenkins, IntelliJ IDEA, Sentry, Celery, GitLab, GitLab CI/CD, Microsoft PowerPoint, Azure Key Vault, Azure Kubernetes服务(AKS), Microsoft Power BI, Azure应用程序洞察, Pytest, Seaborn, Plotly, Apache Airflow, Amazon弹性容器服务(Amazon ECS), Amazon SageMaker
Languages
Python, Scala, Java, TypeScript, Bash, TTCN, JavaScript, SQL, Snowflake, Groovy
Frameworks
Apache Spark, Spark, gRPC, Spring, Play Framework, Django, Django REST Framework, Angular, Streamlit, Scrapy
Paradigms
Data Science, DevOps, Azure DevOps, E2E Testing, ETL, 测试驱动开发(TDD), Scrum, 持续集成(CI)
Storage
PostgreSQL, SQL Server 2017, NoSQL, Amazon S3 (AWS S3)
Platforms
Linux, Docker, Databricks, Azure, Kubernetes, Azure Functions, Azure Synapse, DNN, 亚马逊网络服务(AWS), Amazon EC2
Other
Machine Learning, 人工智能(AI), 机器学习操作(MLOps), 自然语言处理(NLP), GPT, 生成预训练变压器(GPT), Chatbots, MLflow, CI/CD Pipelines, BERT, Dash, Code Review, Azure Data Factory, Azure Data Lake, Delta Lake, Azure容器实例, FastAPI, Time Series Analysis, Azure容器注册表, Statistics, Computer Networking, Data Scraping, Scraping, Web Scraping, Containerization, Neural Networks, Time Series, Algorithms, Deep Learning, Web Applications, DVC
如何使用Toptal
在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.
Share your needs
Choose your talent
开始你的无风险人才试验
对顶尖人才的需求很大.
Start hiring