نشان کن
کد آگهی: KP8133433494

مهندس کلان داده | Big Data Engineer

مهندس کلان داده | Big Data Engineer - زرین رویا | Zarrin Roya
زرین رویا | Zarrin Roya
در تهران
در وبسایت ایران تلنت  (3 روز پیش)
اطلاعات شغل:
نوع همکاری:  Full Time
نیاز به سابقه:  حداقل 3 سال
متن کامل آگهی:

مأموریت شما به عنوان یک مهندس داده بزرگ در Zarrin Roya طراحی ، توسعه و نگهداری سیستم های توزیع شده برای پردازش مجموعه داده های در مقیاس بزرگ است. همچنین شما مسئول ساخت زیرساخت داده های قابل اعتماد ، مقیاس پذیر و کارآمد هستید که به تیم های ما این امکان را می دهد تا به داده ها دسترسی پیدا کنند و تجزیه و تحلیل های پیچیده را در زمان واقعی انجام دهند. مسئولیت های کلیدی:
- ساخت و نگهداری خطوط لوله ETL مقیاس پذیر برای دسته و پردازش داده های زمان واقعی.
- طراحی و پیاده سازی موتورهای پرس و جو SQL با استفاده از Trino و Apache Spark برای تجزیه و تحلیل داده های در مقیاس بزرگ. مدیریت و دسترسی.
- همکاری با دانشمندان و تحلیلگران داده برای ارائه راه حل هایی برای مدل سازی داده ها ، تحول داده ها و تجزیه و تحلیل در زمان واقعی.
- عیب یابی و بهینه سازی عملکرد سیستم های داده توزیع شده برای پاسخگویی خطوط لوله.
- درک جامد از Trino و Apache Spark برای پرس و جو مبتنی بر SQL توزیع شده و پردازش داده های زمان واقعی. Apache Airflow و DBT برای مدیریت گردش کار.
- حل مسئله قوی ، تفکر تحلیلی و مهارت های ارتباطی مؤثر


Your mission as a big data engineer at Zarrin Roya is to design, develop, and maintain distributed systems for processing large-scale datasets. Also, you are responsible for building a reliable, scalable, and efficient data infrastructure that empowers our teams to access data and run complex analytics in real-time.

Key Responsibilities:


  • Build and maintain scalable ETL pipelines for batch and real-time data processing.
  • Design and implement distributed SQL query engines using Trino and Apache Spark for large-scale data analytics.
  • Optimize data processing workflows and ensure real-time querying and analytics.
  • Work with data storage systems like Apache Iceberg, MinIO, and Ceph to ensure efficient data management and accessibility.
  • Collaborate with data scientists and analysts to deliver solutions for data modeling, data transformation, and real-time analytics.
  • Troubleshoot and optimize the performance of distributed data systems to meet SLA requirements.

Requirements:


  • Proficiency in Python or Scala for building data processing systems.
  • Experience with Apache Kafka or Redpanda for streaming data pipelines.
  • Solid understanding of Trino and Apache Spark for distributed SQL-based querying and real-time data processing.
  • Hands-on experience with Apache Iceberg for managing versioned data lakes.
  • Familiarity with object storage solutions like MinIO and Ceph for self-hosted environments.
  • Experience with ClickHouse or other OLAP systems for high-performance analytics.
  • Knowledge of data orchestration tools like Apache Airflow and dbt for managing workflows.
  • Strong problem-solving, analytical thinking, and Effective communication skills.

این آگهی از وبسایت ایران تلنت پیدا شده، با زدن دکمه‌ی تماس با کارفرما، به وبسایت ایران تلنت برین و از اون‌جا برای این شغل اقدام کنین.

هشدار
توجه داشته باشید که دریافت هزینه از کارجو برای استخدام با هر عنوانی غیرقانونی است. در صورت مواجهه با موارد مشکوک،‌ با کلیک بر روی «گزارش مشکل آگهی» به ما در پیگیری تخلفات کمک کنید.
گزارش مشکل آگهی
تماس با کارفرما
این آگهی رو برای دیگران بفرست
نشان کن
گزارش مشکل آگهی
جستجوهای مرتبط
دوشنبه 23 اردیبهشت 1404، ساعت 21:04