من دارم روی یه پروژه کار میکنم — هدفش اینه که یه سیستم هوش مصنوعی بسازیم که بتونه ویدیوهای دوربین (مثلاً امنیت خونه) رو بهصورت زنده پردازش کنه و اتفاقهای خاص رو تشخیص بده.
مثلاً:
یه نفر مدت زیادی یه جا وایساده (loitering)
یه وسیلهی مشکوک جا مونده (abandoned object)
درگیری یا دعوا (fight detection)
تجمع غیرعادی آدمها (crowd surge)
ایده اینه که سیستم این اتفاقها رو تشخیص بده و هشدار بده، ولی تصمیم نهایی همیشه با انسان باشه (یعنی نه سیستم پلیس بازی دربیاره 😅).
از نظر فنی، پروژه شامل چند بخشه:
ورودی ویدیو:
گرفتن استریم RTSP یا فایل ویدیویی با FFmpeg یا OpenCV.
پردازش تصویر:
تشخیص اشیاء با مدلهایی مثل YOLOv8 یا Detectron2،
بعدش ردیابی افراد یا وسایل با DeepSORT یا ByteTrack.
تحلیل رفتار و رخداد:
با دادهی ردیابی، یه منطق ساده بنویسیم که مثلاً تشخیص بده «فلان نفر 2 دقیقه یه جا وایساده» یا «دو تا bounding box بههم نزدیک شدن و حرکت غیرعادی دارن» → هشدار بده.
ذخیره و هشدار:
رخدادها (eventها) برن داخل ElasticSearch یا یه دیتابیس ساده،
بعدش از طریق داشبورد وب (React) نمایش داده بشن با ویدیو و اطلاعات مربوطه.
داشبورد کنترل انسانی:
یه صفحه وب که بتونی هشدارها رو ببینی، تأیید یا رد کنی، و گزارش درست کنی.
هدف اولیه فقط ساخت یه نسخهی PoC (نمونه اولیه) هست که:
2 یا 3 نوع رویداد رو تشخیص بده
با 2 تا دوربین تست کار کنه
خروجی real-time بده (با تاخیر کم)
همه چی قراره ethical باشه، بدون تشخیص چهره یا نقض حریم خصوصی.
اگه پروژه خوب پیش بره، فاز دومش میتونه شامل بهینهسازی GPU یا MLOps بشه (Triton / TorchServe / Dockerized).
استک پیشنهادی:
Python (برای backend و CV pipeline)
PyTorch / YOLOv8
DeepSORT یا ByteTrack
FastAPI برای API
ElasticSearch یا SQLite برای eventها
React + WebSocket/WebRTC برای داشبورد
Docker برای استقرار
توضیح بهتر میخوام یه سیستم هوش مصنوعی بسازیم که بتونه ویدیوهای زندهی دوربین رو ببینه و بفهمه چی داره توش اتفاق میافته.
مثلاً بفهمه یکی زیاد یه جا وایساده، یا یه چیزی افتاده رو زمین، یا دو نفر دارن دعوا میکنن.
یعنی در کل یه «دستیار هوشمند برای نظارت و امنیت» ولی نه جاسوسی و این داستانا 😅 فقط هشدار بده، تصمیم نهایی با آدمه.
قلب پروژه با بینایی ماشینه، یعنی با YOLO یا مدلهای مشابه میخوایم آدم و وسایل رو تو فریم تشخیص بدیم،
بعد با ردیابی (DeepSORT یا ByteTrack) دنبالشون کنیم، و یه منطق ساده بذاریم که مثلاً اگه یکی 2 دقیقه یه جا وایساده → هشدار بده.
دادهها میرن تو یه دیتابیس (مثلاً Elastic یا حتی sqlite ساده)
و یه داشبورد وبی هم داریم که هشدارها رو نشون بده با ویدیو و تایم و نوع اتفاق.
یه چیزی تو مایههای "نسخه کوچیک The Machine" از سریال Person of Interest ولی واقعیتر و اخلاقیتر 😎
فعلاً فقط میخوایم یه نسخهی ساده بسازیم که 2–3 تا رویداد رو تشخیص بده، real-time باشه و از یه دوتا دوربین تست ویدیو بگیره.
همه چی با پایتون، YOLO، FastAPI، React و Docker.
این آگهی از وبسایت کارلنسر پیدا شده، با زدن دکمهی تماس با کارفرما، به وبسایت کارلنسر برین و از اونجا برای این شغل اقدام کنین.
هشدار
توجه داشته باشید که دریافت هزینه از کارجو برای استخدام با هر عنوانی غیرقانونی است. در صورت مواجهه با موارد مشکوک، با کلیک بر روی «گزارش مشکل آگهی» به ما در پیگیری تخلفات کمک کنید.