Art Vancil,美国弗吉尼亚州夏洛茨维尔的开发商
Art is available for hire
Hire Art

Art Vancil

验证专家  in Engineering

数据架构师和开发人员

Location
夏洛茨维尔,弗吉尼亚州,美国
至今成员总数
March 9, 2020

Art拥有25年的数据架构和云计算咨询经验,主要从事企业数据仓库的构建. Art是一个端到端的解决方案架构师和首席问题解决者,有着长期专注执行的历史——根据工作陈述——并在团队环境中成功交付.

Portfolio

AT&T
Synapse, BigQuery, Snowflake, Redshift, Actian, Azure Synapse, SQL...
Lio Insurance
Profisee MDM, Snowflake, matilion ETL for Redshift, SQL Server 2015...
美国联合药房
数据建模,Azure SQL, Microsoft Power BI, Azure数据工厂...

Experience

Availability

Part-time

首选的环境

Azure, t - sql (transact - sql), Microsoft Power BI, PostgreSQL, PL/SQL, Erwin, Azure逻辑应用, Redshift, 亚马逊网络服务(AWS), 工程数据, Architecture, Python, Azure分析服务, Databricks, Salesforce, SQL, Data Science, 商业智能(BI), 数据可视化, Data Loading, 数据库设计, 数据库模式设计, Reporting, Integration, Amazon S3 (AWS S3), Data Analytics, 技术领导, 分布式系统, Cloud, Algorithms, Leadership, 数据仓库设计, 包装消费品, Cloud Storage, 数据架构, 逻辑数据库设计, 数据库体系结构, Excel 2016, Azure砖, Azure Blobs, Azure Queue, 事件驱动架构

最神奇的...

...我开发的软件是一个哈希连接算法,用于连接许多表. 这个大容量解决方案的性能比Db2的表连接高出66%.

工作经验

雪花数据架构师(合同)

2022 - 2023
AT&T
  • 使用数据建模、SQL和Databricks设计Snowflake数据中心.
  • 为离岸开发人员创建ETL规范,并为他们提供指导和测试支持.
  • 对Teradata源数据和Snowflake目标数据进行数据质量测试和验证.
  • 优化和重写查询,使其达到最高的性能水平.
技术:突触, BigQuery, Snowflake, Redshift, Actian, Azure Synapse, SQL, 商业智能(BI), Data Loading, Cloud, 工程数据, IT Strategy, 大数据架构, 数据管理, 交付管理, Engineering, 云架构, PL/SQL Tuning, 关系数据库, 云基础设施, 性能调优, Teradata, 业务需求

MDM数据架构师

2022 - 2022
Lio Insurance
  • 在Profisee中实施客户主主题领域.
  • 根据需求设计数据负载规格.
  • 提取雪花源数据Profisee负载.
  • 为团队领导和解决问题获得强烈的客户反馈.
技术:专业MDM, Snowflake, matilion ETL for Redshift, SQL Server 2015, Master Data, 数据管理, 数据管道, 敏捷项目管理, Engineering, 云架构, PL/SQL Tuning, 数据库事务, Data Migration, ETL Tools, Insurance, 保险科技(Insurtech), 业务需求

Azure数据仓库架构师

2021 - 2022
美国联合药房
  • 使用Azure SQL设计和开发Azure数据仓库, Azure数据工厂, 和Power BI到产品销售和盈利能力分析以及RXAAP网站上嵌入的面向客户的报告.
  • Created relational data models using IDERA ER/Studio; deployed data models to physical Azure SQL databases.
  • 使用Azure数据工厂开发ETL来加载数据仓库表.
  • 使用Power BI创建嵌入在RXAAP网站中的销售和返利报告.
Technologies: 数据建模,Azure SQL, Microsoft Power BI, Azure数据工厂, ER/Studio数据架构, SQL, 商业智能(BI), 数据可视化, Data Loading, 数据库设计, 数据库模式设计, Reporting, Integration, Data Analytics, 技术领导, 分布式系统, Cloud, 工程数据, 主数据管理(MDM), MDM, 数据结构, ETL, 数据管道, Data Lakes, Microsoft SQL Server, 数据仓库设计, File Systems, 数据架构, 逻辑数据库设计, 数据库体系结构, 关键绩效指标(kpi), Microsoft Excel, 数据转换, Data Cleansing, Data Profiling, 敏捷项目管理, Engineering, 云架构, PL/SQL Tuning, XML, GitHub, 关系数据库, 数据库结构, Azure SQL数据仓库(SQL DW), Azure数据湖, OLAP, OLTP, 应用程序体系结构, 云基础设施, ETL Tools, Git, 非结构化数据分析, 业务需求

云数据工程师(合同)

2020 - 2021
麦克奈特咨询集团
  • 执行云大数据基准测试,比较五种大数据工具的性能.
  • 将30TB的行业标准TPC-H测试数据加载到5个不同的数据库平台.
  • 调优数据库存储和索引特性,以优化存储和性能.
  • 执行一组标准SQL查询并调优这些查询的性能.
技术:Actian, Redshift, Snowflake, Synapse, BigQuery, Big Data

AWS云架构师(合同制)

2020 - 2020
歌公司
  • 比较Atlas和MongoDB、DocumentDB和DynamoDB,为实时数据流解决方案推荐性能最佳的解决方案. 确定每个工具的局限性和优点.
  • 执行AWS良好架构审查, 推荐对云环境进行可靠性和性能升级.
  • 创建了一个新的AWS数据流架构,以结合批处理和实时数据更新, 事务日志, 和JSON文档处理.
  • 通过引入GraphQL和DocumentDB,评估并优化了AWS中的实时数据流应用程序.
技术:亚马逊DynamoDB, Atlas, DocumentDB, MongoDB, GraphQL, Apache Kafka, 亚马逊网络服务(AWS), SQL, 商业智能(BI), Amazon S3 (AWS S3), Cloud, 工程数据, 云架构, 数据管道, Engineering, Big Data, AWS Lambda, Amazon EC2, 关系数据库, 消息队列, Amazon RDS, 数据库事务, Transactions, 云基础设施, Oracle Cerner, Insurance, 保险科技(Insurtech), 业务需求

Azure数据架构师(契约)

2020 - 2020
BioTE医疗(通过一家开发机构)
  • 创建数据模型和云架构模型,以大幅重组企业数据库,以便转换为Azure云微服务. 将单片MDM转换为基于域的数据存储.
  • 选择了一个数据库数据设计模式. 实现了用于数据虚拟化的GraphQL中间件.
  • Led the C++ .NET Core团队将产品支持对项目交付的影响降到最低.
  • 创建Power BI仪表板和OLAP数据设计,支持销售和项目绩效.
技术:Microsoft Power BI, Auth0, .NET Core, GraphQL, Azure应用程序洞察, Azure逻辑应用, Azure Cosmos数据库, Redis, Azure事件中心, Apache Kafka, Azure SQL, 云架构, Azure的功能, Engineering, 数据库结构, Bioinformatics, OLAP, OLTP, DevOps, 云基础设施, Data Analysis, DAX

软件发布经理

2018 - 2020
TAMKO建筑产品
  • 解决了嵌入式模块的开发问题.
  • 定义了软件发布过程.
  • 监控每个客户的软件发布进度和成功升级.
技术:嵌入式电源BI, Browsers, 软件开发管理, 人员管理, 敏捷项目管理, 工程管理, 交付管理, Engineering, 云架构, 项目管理

数据科学团队负责人(自由职业者)

2018 - 2020
TAMKO建筑产品
  • 使用关系星型模式存储为制造数据仓库创建远景和策略, ETL, 和Power BI仪表板.
  • 创建了带有Java前端的Power BI交互式分析仪表板,以确定节省了数百万美元的成本并控制制造过程. 设计用于报表的OLAP数据结构.
  • 提出了数据治理方案,包括IT、业务和PMO角色.
  • 监督开发人员和dba通过团队领导实现自助分析, data strategy, 以及执行路线图.
技术:Microsoft Power BI, SAP HANA, Microsoft SQL Server, Azure, SQL Server Management Studio, 统计建模, 仪表板发展, 团队管理, 工程管理, 交付管理, Engineering, 云架构, OLAP, DAX

全球创新分析中心主任

1999 - 2018
日立咨询
  • 为数据科学团队准备业务案例和数据. 为制造业提供了数十个预测分析解决方案, mining, automotive, 交通运输业.
  • 定义预测性维护解决方案, 包括解决方案架构, software, 以及服务组件. 执行poc和客户约定以实现解决方案.
  • 为金融服务提供大规模的全球云迁移到AWS和Azure, pharmaceutical, 以及包括Hadoop在内的制造业公司, Redshift, DevOps, Impala, and Power BI.
  • 定义了大数据产品, 包括Hadoop硬件规范, 物联网机器数据收集, and analysis.
技术:Pentaho数据集成(Kettle), Redshift, Microsoft SQL Server, Hadoop, 机器学习, 管理系统, Transportation & Logistics, 数据管道, 软件开发管理, 人员管理, 团队管理, 工程管理, 交付管理, Engineering, 云架构, Oracle PL/SQL, Unix Shell脚本, XML, 项目管理, 关系数据库, Genomics, OLAP, ETL Tools, SQL Server集成服务(SSIS), SQL Server分析服务(SSAS)

首席数据架构师

1994 - 1999
Kaiser Permanente
  • 带领Kaiser Permanente HEDIS报告临床质量全国第四名.
  • 定义业务需求,以满足医生的报告/分析需求, claims, 医疗质量, 以及财务部门.
  • 提供数据库设计和ETL数据加载流程.
技术:生物识别,生物信息学,数据分析,动态SQL, Oracle Cerner,保险

高级软件工程师

1976 - 1979
通用动力公司
  • 在DEC PDP微型计算机上设计和交付定制的Fortran解决方案,以收集实时飞行仪表数据.
  • 在DEC PDP微型计算机上设计和交付自定义Fortran解决方案,以创建实时测试飞行报告,并为数据收集存储设备提供实时控制.
  • 在DEC PDP微型计算机上设计和交付定制的Fortran解决方案,以控制CNC检测设备的执行.
技术:技术报告, 软件开发生命周期(SDLC), IT基础设施, IT Operations, 软件架构, Engineering, Fortran

为一家领先的半导体制造公司在AWS平台上实施Cloudera

我在AWS平台上进行了Cloudera的试点实施, 提供技术工具方面的建议, architecture, and ETL design. 管理项目任务和可交付成果,设计和开发供应链可追溯性解决方案.

技术栈包括AWS, Cloudera Hadoop, Hue, Impala, Hive, Sqoop, Superset, StreamSets, Tableau, Neo4J, SQL Server, and Oracle.

SalesForce.某网上银行公司的数据提取

我设计了一个用于大容量数据仓库提取的策略, 为1.4亿个账户开发每日指标子系统. 我还每天从AWS向营销云交付100GB的feed,并调整Redshift数据存储和SQL脚本执行性能.

技术栈包括Redshift和营销云.

资产优化解决方案

我定义了日立集团公司间的资产优化解决方案策略, 管理解决方案工件的软件开发, 包括监督离岸开发和数据科学团队. 实施设备健康指数、优化检测周期解决方案.

技术栈包括Domo、Ammo、Pentaho和Oracle企业资产管理(EAM)。.

一家财富100强技术服务公司的运营数据仓库

我使用数据仓库设计技术设计了一个规范化的历史操作数据仓库. 我还在Oracle和SQL Server中开发数据模型和实现物理数据库. In addition, 我为加载数据仓库获取了SAP数据,并为SQL Server星型模式再现了SAP利用率和人工成本计算. Finally, 我设计了Informatica ETL映射需求, 审查来自多个团队的可交付成果, 并指导团队进行数据仓库最佳实践.

技术栈包括Erwin、Oracle、Informatica、Microsoft SQL Server和SAP.

制药服务公司的微服务企业架构

我重新设计了一个 .. NET应用程序用于本地云微服务. 我还设计了一个事件中心发布/订阅消息传递策略和一个标准化的, 使用数据仓库设计技术的历史操作数据仓库. Further on, 在Azure DB中开发数据模型和实现物理数据库, 依靠快速, 使用数据模式和服务模式的敏捷开发.
技术栈包括Microsoft Power BI, Microsoft Azure SQL数据库, Event Hubs, Logic Apps, 应用程序的见解, and Angular.

一家领先的媒体和娱乐公司的分析策略和数据仓库

我在国家设施和网络工程部门为多个应用程序提供数据架构审查和策略, 建议并协助向企业信息工厂体系结构的过渡. In addition, 我介绍了规范化数据建模, 数据仓库数据建模, 以及星型模式数据建模. 我还提出了新的角色,以向卓越的高级分析中心和进一步的SDLC步骤迈进,以支持设计冲刺和变更控制.

技术栈包括OpenJDK、PostgreSQL、RabbitMQ和Pentaho数据集成(PDI)。.

某建筑产品制造公司的企业数据战略

作为数据科学团队的领导者, 我提供团队领导, data strategy, 和执行路线图,以启用自助服务分析. 我还为制造数据仓库创建了远景和战略, 领导两个不同的分析开发团队,共有12名成员. Finally, 我交付了Power BI控制图, 创新分析, 和可视化, 节省数百万美元.

技术栈包括Microsoft SQL Server和SAP HANA环境, Power BI, 和SAP分析云.

Languages

t - sql (transact - sql), SQL, Fortran, Snowflake, Python, R, GraphQL, Python 2, XML

Tools

Microsoft Power BI, Informatica ETL, Erwin, Hue, Impala, Azure逻辑应用, Microsoft Excel, Excel 2016, Lucidchart, STATA, Pentaho数据集成(Kettle), Azure应用程序洞察, Auth0, Actian, BigQuery, Synapse, Tableau, Cloudera, RabbitMQ, 百万ETL的红移, GitHub, Git

Paradigms

数据库设计, Data Science, ETL, 商业智能(BI), 维度建模, OLAP, 敏捷项目管理, 应用程序体系结构, 事件驱动架构, DevOps

Platforms

亚马逊网络服务(AWS), Azure, Databricks, Azure事件中心, Azure的功能, Oracle Cerner, Oracle, SAP HANA, Apache Kafka, Amazon EC2, Salesforce, Pentaho, AWS Lambda

Storage

Microsoft SQL Server, SQL Server Management Studio, PostgreSQL, Azure SQL, Databases, 关系数据库, 数据管道, Data Lakes, 数据库体系结构, Oracle PL/SQL, 数据库结构, Dynamic SQL, SQL架构, Redshift, PL/SQL, Apache Hive, HDFS, Amazon S3 (AWS S3), 主数据管理(MDM), 数据库事务, OLTP, DB, Redis, Azure Cosmos数据库, MongoDB, 亚马逊DynamoDB, Netezza, 用于数据库管理系统, Azure SQL数据库, MySQL, ER/Studio数据架构, JSON, Teradata, Azure Blobs, Azure Queue, SQL Server集成服务(SSIS), SQL Server分析服务(SSAS)

Other

Data Modeling, 数据管理, 解决方案架构, IT Consulting, IT项目管理, Consulting, 数据仓库设计, Leadership, 技术设计, Architecture, 故障排除, 数据架构, 大数据架构, Data Analysis, Data Queries, Big Data, Data, 工程数据, Data Marts, 关系型数据库设计, 云架构, 医疗保健有效性数据和信息集(HEDIS), 数据仓库, Data Loading, 数据库模式设计, Reporting, Integration, Data Analytics, Cloud, 数据结构, 逻辑数据库设计, 信息收集, 数据转换, Data Cleansing, 交付管理, Engineering, PL/SQL Tuning, Azure SQL数据仓库(SQL DW), 云基础设施, Data Migration, ETL Tools, 业务需求, Informatica, 系统集成, AWS云架构, 软件设计, Analytics, 软件开发, 预测分析, 绩效管理, Manufacturing, 医疗保健服务, 敏捷数据科学, 金融服务, 包装消费品, Software, 业务流程分析, Algorithms, Dashboards, 数据可视化, 医疗保健管理系统, Azure Synapse, 技术领导, 分布式系统, MDM, Master Data, IT Strategy, Cloud Storage, File Systems, Data Profiling, 技术咨询, Feasibility, 管理系统, Transportation & Logistics, 软件开发管理, 人员管理, 团队管理, eCommerce, 工程管理, 项目管理, Amazon RDS, Transactions, Azure数据湖, Azure砖, Statistics, 性能调优, DAX, 非结构化数据分析, 保险科技(Insurtech), Data Vaults, 机器学习, DocumentDB, Due Diligence, 软件架构, IT Operations, IT基础设施, Organization, 软件开发生命周期(SDLC), 技术报告, 执行报告, Atlas, Documentation, Oracle R, Government, 数据治理, 数据中心管理, Hardware, Claims, Parquet, 收益管理, Strategy, 物联网(IoT), Azure数据工厂, 计算机科学, 营销云, SAP, 团队的领导, Azure分析服务, Profisee MDM, SQL Server 2015, 嵌入式电源BI, Browsers, 关键绩效指标(kpi), 统计建模, 仪表板发展, Unix Shell脚本, CI / CD管道, 消息队列, Genomics, Biometrics, Security, Delta Lake

Frameworks

Hadoop, .NET Core

行业专业知识

生物信息学,保险,银行 & 金融,汽车,医疗保健

2012 - 2013

临床和公共卫生研究中的定量方法课程

美国马萨诸塞州剑桥市哈佛大学

1973 - 1976

计算机科学学士学位

路易斯安那理工大学-拉斯顿,洛杉矶,美国

2022年6月- 2023年6月

Databricks认证的湖屋基础

Databricks

2013年5月至今

数据科学要件

Cloudera

2013年1月至今

临床和公共卫生研究中的定量方法

哈佛医学院和哈佛公共卫生学院

2012年11月至今

认证云安全知识(CCSK)

云安全联盟

1995年4月至今

认证计算机专业人员

计算机专业人员认证协会