Ben Summers,瑞典乌普萨拉的开发者
Ben is available for hire
Hire Ben

Ben Summers

Verified Expert  in Engineering

数据工程师和机器学习开发人员

Location
Uppsala, Sweden
至今成员总数
June 27, 2019

拥有纯数学博士学位, 本认为自己本质上是个学者, 也就是说他对自己的工作充满热情. 自2012年获得博士学位以来, 他曾在一家大型跨国公司和一家小型初创公司担任过专业的后端和数据工程师. Since 2015, 他一直痴迷于机器学习, 尤其是神经网络, 并且喜欢运用这些技术来解决现实世界的问题. 自2019年以来,Ben一直是Toptal的自由职业者.

Portfolio

Sonbol咨询公司
PyTorch, AWS IoT, 谷歌云平台(GCP), Apache Airflow...
AI框架
AI编程,PyTorch,强化学习,深度强化学习...
Birchbox
Python, SQL, Apache气流,Redshift, Fivetran,数据工程...

Experience

Availability

Full-time

首选的环境

Linux, Git, PyCharm, Jupyter, Python, Python 3, 生成预训练变压器(GPT), Docker, GitHub

The most amazing...

...我做的项目是我的博士学位.D. 写论文并不是一件自然而然的事,它对我构成了真正的挑战.

Work Experience

人工智能和数据顾问

2019 - PRESENT
Sonbol咨询公司
  • 使用PyTorch和PyTorch3D开发了3D机器学习的概念验证.
  • 开发了一个Shopify应用程序,使用GPT生成产品描述.
  • 利用现代计算机视觉技术制作了一个酵母监测器.
  • 使用Fivetran和数据构建工具(dbt)为客户机构建数据仓库.
技术:PyTorch, AWS IoT, 谷歌云平台(GCP), Apache Airflow, 数据构建工具(dbt), ChatGPT, OpenAI GPT-3 API, OpenAI GPT-4 API, LangChain, GPT, Fast.ai, Architecture, Research, API Design, Web Scraping, 机器学习, Python, 机器学习自动化, 监督式机器学习, 生成预训练变压器3 (GPT-3), 开放神经网络交换(ONNX), 生成式人工智能(GenAI), 大型语言模型(llm)

首席科学家

2023 - 2024
AI框架
  • 基于变压器和PPO的深度强化学习,为车辆路线问题开发了定制解决方案, 启用新用例.
  • 部署和支持重型.一个大型电信客户的人工智能,这给各种利益相关者留下了深刻的印象.
  • 设置各种用途的虚拟机和裸金属硬件, 从而更快地发展到POC阶段.
Technologies: AI编程,PyTorch,强化学习,深度强化学习, 变压器模型, 开源llm, 大型语言模型(llm), 大型语言模型操作(LLMOps)

高级/中高级数据工程师

2022 - 2022
Birchbox
  • 创建管道,使用Fivetran从各种来源填充数据仓库(Redshift), 包括使用Terraform在AWS Lambda中定制连接器.
  • 用dbt构建数据仓库(Redshift),用于定义转换.
  • 使用dbt和气流创建从红移到钎焊的反向ETL管道.
  • 使用Python脚本将数据从旧Magento商店迁移到新的Shopify商店.
技术:Python, SQL, Apache气流,Redshift, Fivetran,数据工程, 数据构建工具(dbt), ETL, 商业智能(BI), ELT, Data Analytics, AWS Lambda, Redis, JSON, GitHub, 数据可视化, Data Modeling, Databases, Database Design, 数据库结构, 数据库事务, 软件架构, CI/CD Pipelines, Security, DevOps, 数据架构, Data, 技术架构, ETL Tools, Monitoring, 面向对象编程(OOP), IP Networks, Terraform, Anaconda, Statistics, Architecture, API Design, Dashboards

气流工程师(通过Toptal)

2021 - 2022
Idelic
  • 将现有的ETL作业从传统的基于celery的系统移植到气流上(由天文学家托管). 这些源包括Amazon S3、REST api和SOAP api.
  • 指导团队采用Apache气流最佳实践/约定.
  • 加强了PyCharm, Python, Apache气流和Git的强大经验.
技术:Apache气流, Python, Python 3, Requests, Pandas, Git, GitHub, Docker, 亚马逊网络服务(AWS), Cloud Storage, Infrastructure, APIs, 数据集成, Amazon S3 (AWS S3), 数据聚合, Pipelines, Beautiful Soup, ETL, 工程数据, Cron, Redis, JSON, HTML, SQL, Databases, 数据库事务, Transactions, 软件架构, CI/CD Pipelines, Security, 数据架构, Data, 技术架构, ETL Tools, 面向对象编程(OOP), Anaconda, Statistics, Architecture

3D图形机器学习工程师

2020 - 2021
Toptal Client
  • 设计并实现了一个3D重建管道.
  • 构建了一个高质量的3D重建数据集.
  • 回顾文献,选择最适合客户需求的方法.
  • 使用Azure虚拟机训练带有权重和偏差的机器学习模型,用于实验跟踪.
技术:PyTorch, PyTorch3D, Azure, Data Pipelines, Python, CSV, 机器学习, Python 3, Computer Vision, Data Science, Git, Linear Algebra, 卷积神经网络(CNN), Neural Networks, 概率论, 图像识别, 数据可视化, Cloud Storage, Infrastructure, Data Analysis, Data Reporting, APIs, 数据集成, 数据聚合, Pipelines, 人工智能(AI), Deep Learning, Data Analytics, Cron, 深度神经网络, JSON, GitHub, AI Programming, NVIDIA CUDA, 机器学习操作(MLOps), 软件架构, Security, Data, Modeling, 技术架构, 面向对象编程(OOP), Anaconda, Statistics, Architecture, Research, API Design, 机器学习自动化, 监督式机器学习, Dashboards, 计算机视觉算法, Benchmarking, 生成式人工智能(GenAI)

研究程序员

2019 - 2020
USC ISI(通过Toptal)
  • 改进了跨语言查询汇总系统, 虽然在总结阶段之前是第二名,但最终在评估阶段获胜.
  • 在使用py-spy识别瓶颈后,通过使用近似k近邻算法来嵌入查找,从而提高了实验运行的速度.
  • 通过使用测试和结构化代码来执行设计决策,提高了迭代速度和可靠性.
技术:Doccano, Jupyter, PyCharm, ZeroMQ, Flask, Gensim, 自然语言工具包(NLTK), Python, Python 3, Linux, NumPy, Git, Data Pipelines, CSV, 机器学习, Data Science, 概率论, 数据可视化, Infrastructure, Data Analysis, Data Reporting, APIs, Microsoft Excel, 数据集成, 数据聚合, Beautiful Soup, 人工智能(AI), Deep Learning, Back-end, Data Analytics, Cron, JSON, HTML, AI Programming, Web Development, 自然语言处理(NLP), Language Models, 数据库结构, 软件架构, Security, Data, 技术架构, 面向对象编程(OOP), Anaconda, Statistics, Architecture, Research, API Design, 机器学习自动化, Dashboards, Benchmarking

Data Scientist

2018 - 2019
Instabridge
  • 将数据系统从AWS迁移到Google Cloud.
  • 开发了识别移动WiFi热点的模型.g.比如火车或移动设备上的热点.
  • 通过Android设备的扫描和连接建立模型来估计WiFi热点的位置.
  • 使用dbt(数据构建工具)编写和部署数据模型.
  • 为利益相关者提供各种特别分析.
  • 在谷歌云平台(GCP)上部署扫雪机事件管道,支持Cloud Pub/Sub, Dataflow, BigQuery, 和谷歌计算引擎.
技术:Keras, TensorFlow, Scikit-learn, Pandas, PyTorch, Spark, BigQuery, EMR, ETL, Apache Airflow, Spark ML, 谷歌云平台(GCP), Spark SQL, Python 3, Linux, Big Data, Amazon Kinesis, Redshift, Agile, NumPy, Scala, Git, NoSQL, Data Modeling, Data Pipelines, 工程数据, Google Data Studio, CSV, 机器学习, SQL, Python, Computer Vision, Apache Spark, Data Science, Serverless, Linear Algebra, Neural Networks, LSTM, 概率论, Cloud Dataflow, 数据仓库, 数据仓库设计, 数据可视化, 数据构建工具(dbt), Cloud Storage, Infrastructure, Data Analysis, Data Reporting, APIs, Microsoft Excel, 数据集成, Amazon S3 (AWS S3), 数据聚合, Lambda函数, Pipelines, 亚马逊网络服务(AWS), Beautiful Soup, 人工智能(AI), Deep Learning, OpenAI Gym, Amazon Athena, 商业智能(BI), ELT, Back-end, Data Analytics, AWS Lambda, Cron, Redis, 深度神经网络, JSON, GitHub, HTML, AI Programming, Web Development, 自然语言处理(NLP), Language Models, AWS Glue, Databases, Database Design, 数据库结构, 数据库事务, Transactions, 机器学习操作(MLOps), Amazon Elastic MapReduce (EMR), Hadoop, Java, 软件架构, PySpark, CI/CD Pipelines, Security, DevOps, Data, Modeling, EDA, 探索性数据分析, 技术架构, ETL Tools, Monitoring, 面向对象编程(OOP), IP Networks, Anaconda, Google BigQuery, Statistics, 流处理, 谷歌计算引擎(GCE), Architecture, Research, API Design, R, 机器学习自动化, 监督式机器学习, Dashboards, 计算机视觉算法, Data Lakes

后端开发人员

2015 - 2018
Instabridge
  • 利用Heroku、AWS和GCP设计并实现后端架构.
  • 在Spark中实现数据管道,运行在EMR上,与气流调度.
  • 应用机器学习解决核心数据问题,如估计WiFi热点的位置, 热点的质素, 将热点分为移动热点和静止热点, 公立或私立, 以及匹配热点和场地.
  • 使用AWS Kinesis、lambda函数和DynamoDB实现接近实时的数据管道.
技术:亚马逊网络服务(AWS), Spark, MongoDB, RabbitMQ, 谷歌云平台(GCP), Heroku, Ruby on Rails (RoR), ETL, Apache Airflow, Spark ML, PostgreSQL, JavaScript, Spark SQL, BigQuery, Linux, Big Data, Amazon Kinesis, Redshift, Agile, NumPy, Scala, Git, NoSQL, Data Modeling, Data Pipelines, 工程数据, CSV, 机器学习, SQL, Apache Spark, Data Science, Serverless, Neural Networks, LSTM, 概率论, Cloud Dataflow, 数据仓库, 数据仓库设计, 数据可视化, Cloud Storage, Infrastructure, Data Analysis, Data Reporting, APIs, Microsoft Excel, 数据集成, Amazon S3 (AWS S3), 数据聚合, Lambda函数, Pipelines, Beautiful Soup, 人工智能(AI), Deep Learning, OpenAI Gym, Amazon Athena, 商业智能(BI), ELT, Back-end, Data Analytics, AWS Lambda, Cron, Redis, 深度神经网络, JSON, GitHub, HTML, AI Programming, Web Development, Looker, 自然语言处理(NLP), Language Models, AWS Glue, Databases, Database Design, 数据库结构, 数据库事务, Transactions, 机器学习操作(MLOps), Amazon Elastic MapReduce (EMR), Hadoop, Java, 软件架构, Databricks, PySpark, CI/CD Pipelines, Security, DevOps, 数据架构, Data, Modeling, EDA, 探索性数据分析, 技术架构, ETL Tools, Monitoring, 面向对象编程(OOP), IP Networks, 亚马逊API网关, Google Cloud Composer, Haskell, Anaconda, Google BigQuery, Statistics, 流处理, Architecture, Research, API Design, R, 机器学习自动化, 监督式机器学习, Dashboards, 计算机视觉算法, Data Lakes

解决方案工程师

2013 - 2014
节奏设计系统
  • 为两家领先的电子设计自动化公司之一开发内部生产力/流程web应用程序.
  • 提高了我的团队合作能力.
  • 良好的沟通技巧.
  • 根据业务价值评估并持续排列优先级.
技术:Microsoft 365, Linux, Oracle, Perforce, MySQL, PHP, JavaScript, Data Modeling, CSV, SQL, Infrastructure, APIs, Microsoft Excel, 数据集成, 数据聚合, Selenium, Back-end, Cron, JSON, HTML, Web Development, Databases, Database Design, 数据库结构, 数据库事务, Transactions, 软件架构, Security, 数据架构, Data, 技术架构, 面向对象编程(OOP), Architecture, PL/SQL, 存储过程, API Design

Associate Tutor

2008 - 2012
东英吉利大学
  • 成功地将困难的概念传达给一系列的学生.
  • 数学本科学生标记课程.
  • 帮助数学专业的本科生解决作业问题.
技术:黑板,笔 & 纸张、云存储

基于web的服务器监控和管理工具的荣誉勋章

该工具为部落成员提供了不同级别的监控访问权限, warn, 踢球员, 以及改变地图, etc.,而不会暴露实际的全有或全无服务器管理员密码. 后端是用PHP编写的,包含大量套接字编程、会话和用户身份验证. 客户端工具是使用c#和 .NET.

订阅盒服务的五传输自定义连接器

我构建了自定义连接器,允许Fivetran将原生不支持的数据源加载到客户机的数据仓库中. 我们使用Terraform和GitHub Actions以CI/CD的方式在AWS中进行了测试和部署.

Shopify应用程序的人工智能生成的产品描述

http://www.sonbol.se
我创建了一个Shopify应用程序,它使用OpenAI的GPT API生成产品描述. 这是一个个人项目,了解更多关于GPT和Shopify应用程序, 基于之前使用Shopify的经验(主要是REST和GraphQL api).

Languages

Python, SQL, Python 3, JavaScript, HTML, PHP, Haskell, Scala, Java,存储过程,R

Libraries/APIs

LSTM, PyTorch, TensorFlow, Fast.ai, Spark ML, FFmpeg, Keras, PySpark, Scikit-learn, 自然语言工具包(NLTK), ZeroMQ, Pandas, NumPy, OpenCV, Requests, Beautiful Soup, Node.js

Tools

BigQuery, Amazon Elastic MapReduce (EMR), Spark SQL, Apache Airflow, Cron, Microsoft Excel, Jupyter, PyCharm, Git, Perforce, Gensim, Doccano, RabbitMQ, 谷歌计算引擎(GCE), Terraform, Cloud Dataflow, Google Cloud Composer, GitHub, OpenAI Gym, Amazon Athena, Looker, ChatGPT, AWS Glue

Paradigms

ETL, Data Science, Database Design, 函数式编程, 面向对象编程(OOP), 商业智能(BI), Serverless架构, Agile, 搜索引擎优化(SEO), DevOps

Platforms

Linux, 谷歌云平台(GCP), 亚马逊网络服务(AWS), Heroku, AWS Lambda, Oracle, Blackboard, Arduino, Anaconda, Azure, Docker, NVIDIA CUDA, Databricks, AWS IoT, Shopify

Storage

Amazon S3 (AWS S3), JSON, Databases, 数据库结构, 数据库事务, PostgreSQL, NoSQL, Data Pipelines, 数据集成, Redis, Data Lakes, Redshift, MySQL, MongoDB, PL/SQL

Other

EMR, 卷积神经网络(CNN), Linear Algebra, Google BigQuery, Neural Networks, Deep Learning, 人工智能(AI), 机器学习, 工程数据, 深度神经网络, CSV, Cloud Storage, Data Analysis, APIs, 数据聚合, Pipelines, Back-end, Data Analytics, AI Programming, Transactions, 数据架构, Data, EDA, 探索性数据分析, 技术架构, ETL Tools, Architecture, Research, API Design, 机器学习自动化, 监督式机器学习, 自然语言处理(NLP), 概率论, 流处理, IP Networks, 图像识别, Statistics, 深度强化学习, Computer Vision, Audio, 音频处理, 数字信号处理, Data Modeling, 数据仓库, 数据仓库设计, 数据可视化, 数据构建工具(dbt), Infrastructure, Data Reporting, ELT, GPT, 生成预训练变压器(GPT), Web Development, Language Models, 软件架构, CI/CD Pipelines, Security, Modeling, Dashboards, 计算机视觉算法, 生成式人工智能(GenAI), 大型语言模型(llm), Serverless, Big Data, 亚马逊API网关, 强化学习, Amazon Kinesis, Microsoft 365, Pen & Paper, 生成对抗网络(GANs), PyTorch3D, Google Data Studio, Lambda函数, Fivetran, Lean, OpenAI GPT-3 API, OpenAI GPT-4 API, 机器学习操作(MLOps), LangChain, Monitoring, FastAPI, Web Scraping, 生成预训练变压器3 (GPT-3), 开放神经网络交换(ONNX), Benchmarking, 变压器模型, 开源llm, 大型语言模型操作(LLMOps)

Frameworks

Apache Spark, Spark, Flask, Django, Ruby on Rails (RoR), Selenium, Hadoop, Next.js

2014 - 2015

希腊语言和文化CEFR B2

约阿尼纳大学-约阿尼纳,希腊

2008 - 2012

Ph.数学博士

东安格利亚-诺里奇大学,英国

2004 - 2008

数学硕士学位

东安格利亚-诺里奇大学,英国

有效的合作

如何使用Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

分享你的需求

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

选择你的才能

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring