درباره موقعیت
مهندس DevOps با تمرکز بر طراحی، پیادهسازی و نگهداری زیرساخت مبتنی بر Kubernetes و میکروسرویسها، تضمین امنیت، CI/CD و مانیتورینگ سیستمهای مقیاسپذیر را بر عهده خواهد داشت .
مسئولیتها
معماری و استقرار زیرساخت:
راهاندازی و مدیریت Kubernetes کلاستر شامل مستر و ورکر نودها با تفکیک Namespace برای جداسازی ماژولار سرویسها (frontend, backend, blockchain) .
طراحی شبکه خصوصی درونکلاستری و پیادهسازی API Gateway برای کنترل دسترسی خارجی .
مدیریت میکروسرویسها:
استقرار و نگهداری بیش از 20 سرویس میکروسرویس (مانند apigateway، notification، matchengine و…) بهصورت مستقل در پادها با DNS و Service Discovery داخلی .
دیتابیس و ذخیرهسازی:
راهاندازی و پیکربندی PostgreSQL با Master/Slave replication بر روی سه نود و اتصال از طریق ClusterIP Service .
مدیریت خوشه MinIO برای ذخیرهسازی فایل با سیاستهای namespaceمحور دسترسی و استقرار بر روی سه نود مستقل .
امنیت زیرساخت:
پیادهسازی TLS برای کلیه ارتباطات داخلی میکروسرویسها (gRPC) و مدیریت احراز هویت و مجوزدهی از طریق API Gateway پیکربندی RBAC و NetworkPolicy در Kubernetes برای محدودسازی دسترسی پادها و نگهداری Secrets رمزنگاریشده .
CI/CD با GitLab:
طراحی و نگهداری Pipelineهای GitLab-CI با مراحل Build، Test و Deploy.
پیادهسازی استقرار خودکار به محیط Staging و تأیید دستی برای Production؛ استفاده از Helm و GitLab Runners برای Deployment به کلاستر Kubernetes .
پشتیبانی از استراتژیهای Rolling Update و Canary Deployment و Rollback خودکار پس از تستهای Post-Deploy مانیتورینگ و هشداردهی:
راهاندازی Prometheus Stack برای جمعآوری متریکهای Node Exporter، Kube-State-Metrics و PushGateway.
طراحی داشبوردهای Grafana برای نظارت بر سلامت نودها، مصرف CPU/Memory، وضعیت MinIO/Kafka و زمان پاسخ API .
پیکربندی Alertmanager برای ارسال هشدار به کانال تلگرام بر اساس معیارهای بحرانی (Down بودن پاد، CPU>90%) و تعریف Alertهای سفارشی براساس الگوهای لاگ .
لاگبرداری و تحلیل خطا:
پیادهسازی Fluentd (یا Fluent-bit) برای جمعآوری لاگ و ارسال به Graylog.
تعریف شاخصها و فیلترهای لاگ در Graylog و راهاندازی هشدارهای مبتنی بر کلیدواژههای حساس (panic, unauthorized, transaction failed) .
مهارتها و تجربه مورد نیاز
● مسلط به Kubernetes: طراحی Namespace، RBAC، NetworkPolicy و استقرار میکروسرویسها .
● تجربه با GitLab-CI/CD: ساخت Pipeline، Helm، GitLab Runners و استراتژیهای Canary/Rolling Update .
● آشنا به ابزارهای ذخیرهسازی ابری: MinIO و پیادهسازی Replication .
● پایگاه داده PostgreSQL: پیکربندی Master/Slave replication و سرویسدهی از طریق ClusterIP .
● امنیت زیرساخت و شبکه: TLS، API Gateway، مدیریت Secrets و سیاستهای دسترسی Kubernetes .
● مانیتورینگ و لاگبرداری: Prometheus, Grafana, Alertmanager, Fluentd/Graylog .
● مهارتهای نرم: توانایی کار تیمی، مستندسازی، حل مسأله و مدیریت زمان.