Meghana is available for hire

Meghana Bhange

验证专家 in Engineering

软件开发人员

Location

加拿大蒙特利尔，QC

至今成员总数

2022年10月27日

Meghana是一名机器学习工程师，热衷于以数据驱动的方式解决问题. 她目前正在可信信息系统实验室攻读硕士学位，研究重点是隐私保护技术, ÉTS Montréal. 她在自然语言处理方面有经验，之前曾在SemEval-2020上发表过作品. Meghana热衷于从事创造性项目，并总是寻找新的方法来应用她的技能.

Portfolio

UInclude, Inc

自然语言处理(NLP)，机器学习，GPT...

ETS蒙特利尔的TISL实验室

Python 3，人工智能，Scikit-learn

自由端

人工智能(AI)、聊天机器人、OpenAI GPT-3 API...

Experience

自然语言处理(NLP) - 4年 Python - 2年 Kubernetes - 2年机器学习- 2年 GPT - 2 years Django - 1年 SQL - 1 year 亚马逊SageMaker - 1年

Availability

Part-time

首选的环境

生成预训练变形器(GPT)，自然语言处理(NLP)，人工智能设计

最神奇的...

...我参与的项目是开发一个端到端的自定义识别服务，该服务基于资源受限的代码混合设置，具有低延迟需求.

工作经验

AI Engineer

2023年至今

UInclude, Inc

利用SpaCy和基于规则的引擎开发了一个特定于上下文的偏倚词匹配模型，以识别工作列表中的偏倚词.
使用句子转换器和GPT-3创建了同义词扩充器，以发现上下文特定的同义词, 用无偏见的替代词取代工作列表中有偏见的词.
使用AWS上的FastAPI端点部署模型，同时通过DynamoDB存储和查询数据.

Technologies: 自然语言处理(NLP)，机器学习，GPT, 生成预训练变压器(GPT), 亚马逊网络服务(AWS), Deep Learning, Python, TensorFlow, Scikit-learn, 亚马逊DynamoDB, Amazon S3 (AWS S3), FastAPI, SpaCy

Researcher

2022 - PRESENT

ETS蒙特利尔的TISL实验室

研究了一个投诉申诉系统的隐私保护ML和数据发布.
研究了基于反事实解释api的机器学习系统的模型提取攻击.
建模一个可以利用反事实解释提供的信息来构建高保真度和高精度模型提取攻击的对手.
在Folktables数据集上对模型性能进行基准测试, 提取的模型保真度在97左右.6%.

技术:Python 3，人工智能(AI)， Scikit-learn

AI Developer

2023 - 2023

自由端

为家长和学生定制的基于GPT-4的聊天界面开发了fastapi端点. 成功地在DigitalOcean上部署了应用程序，确保了强大的性能和可扩展性.
通过与LangChain集成增强了聊天端点, 整合像维基百科这样的插件, Search, and Math. 这种集成提高了信息的可靠性.
利用矢量数据库查询文档，提高信息检索的可靠性. 开发了能够分析聊天历史以提取相关主题和概念的端点.

Technologies: 人工智能(AI)、聊天机器人、OpenAI GPT-3 API, 生成预训练变压器(GPT), ChatGPT, LangChain

OpenAI开发人员

2023 - 2023

Zurney.app

构建一个集成了GPT-3 API的FastAPI后端，生成旅行行程并提取地点. 然后用坐标对这些位置进行地理编码.
Built a Next.js应用程序显示旅行行程，并显示谷歌地图上的地理位置颜色代码对应的日子在旅行和有关每个位置的信息.
dockerization和部署FastAPI后端和Next.. js前端到DigitalOcean.

技术:人工智能(AI)、ChatGPT、OpenAI、Next.js, FastAPI, DigitalOcean, 大型语言模型(llm), 自然语言处理(NLP), 生成预训练变压器(GPT), GPT, Web开发, OpenAI GPT-3 API

机器学习工程师

2021 - 2022

Hunters.ai

研究并构建用于评估威胁搜索检测器和理解检测输出中的异常模式的分析工具.
组织机器学习检测器的监控和质量检查基础设施.
创建了一个深入调查威胁的框架.

技术:Python 3, 机器学习, SQL, 人工智能(AI), Deep Learning, Scikit-learn, AI Design, 机器学习操作(MLOps), 亚马逊SageMaker, Kubernetes, APIs, 数据管道, 亚马逊网络服务(AWS), PostgreSQL, 工程数据, Amazon S3 (AWS S3), 亚马逊DynamoDB

机器学习工程师

2020 - 2021

The Verloop.io

对意图识别服务做出贡献，使用句子转换器提高top-K的查全率和准确率, 这将F1提高了40%.
设计、构建并部署跨所有客户端的多语言名称识别服务.
评估各种语言模型(如ULMFiT和VAMPIRE)在低资源语言上下文中的性能.
使用生成式预训练变压器3 (GPT3)人工智能在聊天机器人中为FAQ系统创建合成训练数据.

技术:机器学习, Python 3, Pandas, SpaCy, Chatbots, OpenAI, 人工智能(AI), Deep Learning, Scikit-learn, AI Design, Django, Google Cloud, 谷歌云平台(GCP), 语音识别, APIs, Web开发, 文本生成, 语言模型, 大型语言模型(llm), Flask, 数据管道, 机器学习操作(MLOps), 计算语言学, DaVinci, 生成预训练变压器(GPT), PostgreSQL

机器学习实习生

2019 - 2019

The Verloop.io

创建了为多语言对话定制的人名提取器. Tweaked Flair, Facebook的自然语言处理库, 用英语处理低延迟的用例, Spanish, and French.
与之前部署的FastText模式相比，最终模型在F1中的效率提高了47%.
将开发的多语言名称提取器部署到生产环境中，总延迟低于500毫秒.

技术:人工智能(AI), Chatbots, Deep Learning, Scikit-learn, 文本生成, 语言模型, 大型语言模型(llm), Flask, PostgreSQL

Experience

使用反事实解释的模型提取攻击

这是我与ETS蒙特利尔可信信息系统实验室合作的一个研究项目. 我们研究了模型攻击者如何利用反事实解释提供的信息来构建高保真度和高精度的模型提取攻击.

LitNER |文学命名实体识别

http://github.com/meghanabhange/litNER

基于Spacy3在LitBank数据集上训练的命名实体识别. 该项目使用Roberta XLM作为基础模型和经过微调的文献数据来理解文献中常用的术语. 该项目发布的预训练模型也可用于对任何文学文本执行NER任务.

英语推特情感检测| SemEval2020

http://arxiv.org/abs/2008.09820

这项工作增加了两种常见的方法, 微调大型变压器模型和采样高效方法，如ULMFiT. 先前的工作证明了经典ML方法对极性检测的有效性. 我们对通用语言表示模型进行了微调, 比如伯特家族的人, 哪些是与经典机器学习和集成方法一起进行基准测试的. 我们发现NB-SVM比RoBERTa多6分.2%. 表现最好的模型是多数投票集成模型，其F1值为0.707.

维基百科教科书助手

http://github.com/meghanabhange/Wikipedia-Textbook-Assistant

简单的流光应用程序与教科书配对，以便人们可以轻松地从他们正在阅读的文本中提取关键短语，并从维基百科获得详细信息，以了解相关上下文.

人工精神错乱(稳定扩散反人类卡牌)| total Hackathon

人工疯狂是一款面向Toptal黑客马拉松的多人游戏, 它使用稳定扩散生成文本提示的图像响应. In each round, 玩家选择提示, 和其他玩家使用集成的稳定扩散界面生成响应.

我根据DALLE和稳定的扩散的质量和延迟对性能进行了基准测试. Also, 我在FastAPI上部署了最终的模型，使其更容易与后端的其余部分集成. 这个解决方案在黑客马拉松中获得了二等奖.

Education

2023 - 2023

信息技术工程专业硕士学位(在读)

École de Technologie supsamrieure -蒙特利尔，加拿大

2016 - 2020

电子与通信工程专业本科以上学历

Savitribai浦那大学-印度浦那

Skills

库/ api

Pandas, Scikit-learn, SpaCy, TensorFlow

Tools

Slack，命名实体识别(NER)，亚马逊SageMaker, ChatGPT

Frameworks

Django, Flask, Streamlit, Next.js

Languages

Python, SQL, Python 3

Storage

数据管道，PostgreSQL, Amazon S3 (AWS S3)，亚马逊DynamoDB, Google Cloud

行业专业知识

Cybersecurity

Platforms

Kubernetes, 谷歌云平台(GCP), 亚马逊网络服务(AWS), Visual Studio Code (VS Code), DigitalOcean, AWS Lambda

Other

机器学习, 自然语言处理(NLP), 人工智能(AI), Deep Learning, APIs, 文本生成, 语言模型, GPT, 工程数据, Chatbots, OpenAI, AI Design, 机器学习操作(MLOps), 大型语言模型(llm), 计算语言学, 生成预训练变压器(GPT), OpenAI GPT-3 API, Research, 转移学习, BERT, Signals, 信息理论, Custom BERT, 稳定的扩散, DALL-E, FastAPI, Inference API, 语音识别, Web开发, DaVinci, Systems, Cryptography, 信息技术, 提示工程, LangChain

有效的合作

如何使用Toptal

在数小时内，而不是数周或数月，我们的网络将为您直接匹配全球行业专家.

分享你的需求

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.

选择你的才能

在24小时内获得专业匹配人才的简短列表，以进行审查，面试和选择.

开始你的无风险人才试验

与你选择的人才一起工作，试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring