高级数据工程师与商业智能开发人员 | 远程SQL/Python专家
远程
全职
您是否是一位经验丰富的数据专业人士,希望设计能够推动业务决策的复杂数据解决方案?我们不断发展的技术团队需要一位杰出的高级数据工程师与商业智能开发人员,来设计和实施企业级数据管道和分析平台。您将使用SQL、Python和现代数据技术将复杂的数据集转化为可行的洞察,同时享受100%远程工作的灵活性。
主要职责:
- 使用现代框架(如Apache Airflow或dbt数据构建工具)设计和开发可扩展、高性能的数据管道和ETL/ELT流程。
- 在云平台(AWS Redshift、Azure Synapse、GCP BigQuery)上架构强健的数据仓库解决方案,实施维度建模技术。
- 在各种数据库系统(MySQL 8.0+、SQL Server 2019+、PostgreSQL)中编写优化的SQL查询,以实现高效的数据提取和转换。
- 实施数据质量监控系统,配备自动验证检查,确保99.9%以上的数据准确性和可靠性。
- 使用星型模式和雪花设计开发复杂的数据模型,准确表示复杂的业务流程。
- 使用Power BI、Tableau或Looker等工具创建交互式仪表板和可视化,向利益相关者有效传达见解。
- 应用统计方法(回归分析、时间序列预测)识别业务数据中的重要模式和异常。
- 与跨职能团队合作,将业务需求转化为技术数据解决方案,并提供清晰的文档。
- 优化数据处理工作流程,使执行时间比现有解决方案至少减少30%。
- 关注新兴数据技术的发展,实施能够增强我们数据能力的创新方案。
必备技能和经验:
- 作为数据工程师、商业智能开发人员或类似角色的丰富经验(4年以上),具有可证明的项目成功案例。
- 在各种数据库平台上的高级SQL能力,特别是MySQL 8.0+、SQL Server 2019+和PostgreSQL。
- 对数据仓库架构的深入理解,包括维度建模、星型架构和数据仓库方法论。
- 使用Informatica、SSIS或自定义Python解决方案设计和实施ETL/ELT工作流的经验。
- 精通Python 3.8+进行数据操作,熟练使用pandas、NumPy和SQLAlchemy等库。
- 至少有一个主要云数据平台的实践经验:AWS(Redshift、Glue、EMR)、Azure(Synapse、Data Factory)或GCP(BigQuery、Dataflow)。
- 数据可视化工具(Power BI、Tableau、Looker)的实际使用经验,能够创建有见地的仪表板。
- 统计学的坚实基础,能够应用假设检验、回归分析和时间序列分析等方法。
- 实施数据质量框架的经验,具有明确的指标和监控系统。
- 强大的问题解决能力,注重细节和性能优化。
加分项:
- 使用Snowflake、BigQuery或Redshift等现代云数据仓库的经验,熟悉优化技术。
- 使用Apache Kafka、Spark Streaming或AWS Kinesis进行流数据处理的知识。
- 精通Apache Airflow 2.0+、Luigi或Prefect等数据编排工具。
- 使用MongoDB、Cassandra或Amazon DynamoDB等NoSQL数据库的实践经验。
- 了解数据科学工作流程并能够支持机器学习管道。
- 使用GitHub Actions或Jenkins为数据项目进行版本控制(Git)和CI/CD实践的经验。
- 专业认证,如AWS认证数据分析师、Azure数据工程师或Google专业数据工程师。
- 使用Collibra或Alation等工具实施数据治理框架的背景。
- 使用Docker容器化和Kubernetes编排数据工作负载的经验。
- 在数据项目中使用Scrum或Kanban方法的敏捷开发经验。
为什么加入我们:
在我们的团队工作,您将有机会解决推动实际业务影响的复杂数据挑战。您将享受远程工作的灵活性,同时使用前沿技术构建创新数据解决方案。我们提供具有竞争力的薪酬,通过会议参与和培训预算提供持续学习机会,以及重视您专业知识的协作文化。加入我们,在从事重要数据项目的同时推进您的职业发展。