نشان کن
کد آگهی: KP5564234214

کارشناس SRE | SRE Expert

کارشناس SRE | SRE Expert - کارگزاري آگاه | Agah Broker
کارگزاري آگاه | Agah Broker
در تهران
در وبسایت ایران تلنت  (1 هفته پیش)
اطلاعات شغل:
نوع همکاری:  Full Time
نیاز به سابقه:  حداقل 3 سال
متن کامل آگهی:

یک مهندس قابلیت اطمینان سایت (sre) نقشی اساسی در حصول اطمینان از اینکه خدمات و زیرساخت های سازمان بسیار در دسترس، مقیاس پذیر و کارآمد هستند، ایفا می کند. این موقعیت اغلب شامل ترکیبی از وظایف توسعه، عملیات و عیب‌یابی است.

قابلیت اطمینان و در دسترس بودن سیستم: اطمینان از دسترسی و قابلیت اطمینان بالای خدمات و زیرساخت‌ها. این شامل نظارت فعال، پاسخ حادثه، و تجزیه و تحلیل پس از مرگ برای جلوگیری از تکرار حوادث می شود.
مدیریت عملکرد: نظارت و بهینه سازی عملکرد سیستم برای دستیابی به اهداف سطح خدمات (slos) و توافقات سطح خدمات (slas). این امر مستلزم درک و مدیریت ظرفیت و مقیاس پذیری خدمات است.
مدیریت و واکنش حوادث: منجر به پاسخگویی به قطعی سیستم و مسائل مربوط به عملکرد، از جمله وظایف حین تماس می شود. توسعه ابزارهای اتوماسیون برای کمک به حل سریع حوادث و جلوگیری از تکرار آنها.
اتوماسیون و ابزارسازی: طراحی و پیاده سازی ابزارها و چارچوب های اتوماسیون برای کاهش کارهای عملیاتی دستی. این می‌تواند شامل اسکریپت‌هایی برای استقرار، نظارت و مدیریت زیرساخت باشد.
همکاری متقابل: همکاری نزدیک با تیم‌های توسعه برای طراحی و پیاده‌سازی سیستم‌های مقیاس‌پذیر، قابل اعتماد و کارآمد. این شامل ارائه ورودی در مورد تصمیمات معماری، بهینه سازی استفاده از منابع، و اطمینان از انعطاف پذیری سیستم است.
بهبود مستمر: تجزیه و تحلیل مداوم فرآیندها و سیستم های فعلی برای فرصت های بهبود. بهترین شیوه‌ها را برای قابلیت اطمینان و در دسترس بودن سیستم اجرا کنید.
بازیابی و پشتیبان‌گیری از بلایا: برنامه‌های بازیابی بلایا را توسعه دهید و حفظ کنید، از جمله آزمایش‌های منظم برای اطمینان از انعطاف‌پذیری سیستم.
اسناد: مستندات دقیق معماری سیستم، پیکربندی‌ها، فرآیندها و سوابق خدمات برای اطمینان از اینکه دانش در تیم به اشتراک گذاشته می شود و در دسترس است.

نیازها / مهارت ها

آموزش: a مدرک لیسانس در علوم کامپیوتر، مهندسی، یا یک رشته مرتبط، یا تجربه عملی معادل.
تجربه: تجربه اثبات شده در نقش مهندسی قابلیت اطمینان سایت یا موارد مشابه، با پیشینه قوی در توسعه نرم افزار و مدیریت سیستم.
مهارت های فنی :
- مهارت در زبان های برنامه نویسی.
- تجربه با خدمات ابر و ابزارهای هماهنگ سازی کانتینر (kubernetes، docker).
- درک قوی از اصول و پروتکل های شبکه.
- تجربه با یکپارچه سازی و استقرار مداوم (ci/cd) شیوه ها.
مهارت های حل مشکل: توانایی عیب یابی و حل مسائل پیچیده فنی تحت فشار.
مهارت های ارتباطی: کلامی عالی و مهارت های ارتباطی نوشتاری، با توانایی انتقال موثر مفاهیم فنی به ذینفعان غیر فنی.
کار تیمی: توانایی کار به طور مشترک در یک تیم متقابل کارکردی و تعامل موثر با توسعه دهندگان، تیم های عملیاتی و مدیریت.

مزایای شغلی
وام
بیمه سلامت
اتاق بازی
تنقلات
صبحانه< br>ناهار
بسته ها و هدایای مناسب
کمک هزینه های آموزشی
فضای استراحت


A Site Reliability Engineer (SRE) plays a pivotal role in ensuring that an organization's IT services and infrastructure are highly available, scalable, and efficient. This position often involves a blend of development, operations, and troubleshooting tasks.


  • System Reliability and Availability: Ensure high availability and reliability of services and infrastructure. This includes proactive monitoring, incident response, and post-mortem analysis to prevent recurrence of incidents.
  • Performance Management: Monitor and optimize system performance to meet the service level objectives (SLOs) and service level agreements (SLAs). This involves understanding and managing the capacity and scalability of services.
  • Incident Management and Response: Lead the response to system outages and performance issues, including on-call duties. Develop automation tools to help in the rapid resolution of incidents and to prevent their recurrence.
  • Automation and Tooling: Design and implement automation tools and frameworks to reduce manual operational work. This could include scripts for deployment, monitoring, and infrastructure management.
  • Cross-functional Collaboration: Work closely with development teams to design and implement scalable, reliable, and efficient systems. This involves providing input on architectural decisions, optimizing resource utilization, and ensuring system resilience.
  • Continuous Improvement: Continuously analyze current processes and systems for improvement opportunities. Implement best practices for system reliability and availability.
  • Disaster Recovery and Backup: Develop and maintain disaster recovery plans, including regular testing to ensure system resilience.
  • Documentation: Maintain detailed documentation of the system architecture, configurations, processes, and service records to ensure that the knowledge is shared and accessible within the team.

Requirements:


  • Bachelor's degree in Computer Science, Engineering, or a related field, or equivalent practical experience.
  • Proven experience in a site reliability engineering role or similar, with a strong background in software development and system administration.
  • Technical Skills:
  • Proficiency in programming languages.
  • Experience with cloud services and container orchestration tools (Kubernetes, Docker).
  • Strong understanding of networking principles and protocols.
  • Experience with continuous integration and deployment (CI/CD) practices.
  • Problem-Solving Skills: Ability to troubleshoot and resolve complex technical issues under pressure.
  • Communication Skills: Excellent verbal and written communication skills, with the ability to effectively communicate technical concepts to non-technical stakeholders.
  • Teamwork: Ability to work collaboratively in a cross-functional team and interact effectively with developers, operations teams, and management.

Job Benefits:


  • Loans.
  • Health insurance.
  • Game room.
  • Snacks.
  • Breakfast.
  • Lunch.
  • Occasional packages and gifts.
  • Learning stipends.
  • Resting space.

این آگهی از وبسایت ایران تلنت پیدا شده، با زدن دکمه‌ی تماس با کارفرما، به وبسایت ایران تلنت برین و از اون‌جا برای این شغل اقدام کنین.

هشدار
توجه داشته باشید که دریافت هزینه از کارجو برای استخدام با هر عنوانی غیرقانونی است. در صورت مواجهه با موارد مشکوک،‌ با کلیک بر روی «گزارش مشکل آگهی» به ما در پیگیری تخلفات کمک کنید.
گزارش مشکل آگهی
تماس با کارفرما
این آگهی رو برای دیگران بفرست
نشان کن
گزارش مشکل آگهی
یک‌شنبه 2 دی 1403، ساعت 18:34